Verschil tussen datamining en data warehousing

Schrijver: Laura McKinney
Datum Van Creatie: 2 April 2021
Updatedatum: 12 Kunnen 2024
Anonim
Database vs Data Warehouse
Video: Database vs Data Warehouse

Inhoud


Datamining en datawarehousing worden beide gebruikt om business intelligence te bevatten en besluitvorming mogelijk te maken. Maar zowel datamining als datawarehousing hebben verschillende aspecten van het werken met de gegevens van een onderneming. Enerzijds de datawarehouse is een omgeving waarin de gegevens van een onderneming worden verzameld en opgeslagen op een geaggregeerde en samengevatte manier. Aan de andere kant, data mining is een proces; die algoritmen toepassen om kennis te extraheren uit de gegevens waarvan u niet eens weet dat ze in de database voorkomen.

Laten we het verschil tussen datamining en datawarehousing bekijken met behulp van een onderstaande vergelijkingstabel.

  1. Vergelijkingstabel
  2. Definitie
  3. Belangrijkste verschillen
  4. Gevolgtrekking

Vergelijkingstabel

Basis voor vergelijkingDataminingData opslagplaats
basis- Datamining is een proces om betekenisvolle gegevens uit een database / datawarehouse op te halen of te extraheren.Datawarehouse is een repository waar de informatie uit meerdere bronnen wordt opgeslagen onder één schema.


Definitie van datamining

Datamining is een proces om ontdek kennis, welke jij nooit verwacht naar bestaan ​​in uw database. Met de traditionele querytool kunt u alleen de bekende informatie uit de gegevens ophalen. Maar datamining biedt u de manier om haal verborgen informatie uit de gegevens. Datamining haalt zinvolle informatie uit de database die kan worden gebruikt besluitvorming.

De kennisontdekking in databases, aangeduid als KDDvertoont verhouding en patroon. De relatie kan liggen tussen twee of meer verschillende objecten, tussen attributen van hetzelfde object. Patroon is een ander resultaat van datamining dat de regelmatige en begrijpelijke opeenvolging van informatie toont die helpt bij de besluitvorming.

De stappen die betrokken zijn bij KDD, d.w.z. kennisdetectie in databases, kunnen als eerste worden samengevat, selectie van dataset waarop datamining moet worden uitgevoerd. Volgende is voorverwerking waarbij inconsistente gegevens worden verwijderd. Dan komt datatransformatie waar de gegevens worden omgezet in de vorm die geschikt is voor datamining. Volgende is data mining, hier worden de datamining-algoritmen op de gegevens toegepast. En tenslotte, interpretatie en evaluatie waarbij de relatie of het patroon tussen de gegevens wordt geëxtraheerd.


Datamining past goed in de datawarehouse-omgeving die gegevens op een geaggregeerde en samengevatte manier heeft opgeslagen. Omdat het gemakkelijk wordt om de gegevens in het datawarehouse te minen

Definiëren van data warehousing

Data Warehouse is een centrale locatie waar informatie verzameld uit meerdere bronnen worden opgeslagen onder één uniform schema. De gegevens worden in eerste instantie verzameld, verschillende bedrijfsbronnen worden vervolgens opgeschoond en getransformeerd en opgeslagen in een datawarehouse. Nadat gegevens in een gegevensmagazijn zijn ingevoerd, blijven ze daar lang en zijn ze toegankelijk voor over tijd.

Data Warehouse is een perfecte mix van technologieën zoals gegevensmodellering, gegevensverzameling, gegevensbeheer, metagegevensbeheer, winkelhulpmiddelen voor ontwikkelingstools. Al deze technologieën ondersteunen functies zoals gegevensextractie, gegevenstransformatie, gegevensopslag, gebruikersinterfaces bieden voor toegang tot de gegevens.

Datawarehouse is geen product of software, het is een informatieomgeving die informatie biedt als een geïntegreerd beeld van een onderneming. U hebt toegang tot de huidige en historische gegevens van de onderneming, wat helpt bij het nemen van beslissingen. Het ondersteunt transacties voor besluitvorming zonder de operationele systemen te beïnvloeden. Het is een flexibele bron om strategische informatie te verkrijgen.

  1. Er is een fundamenteel verschil dat data mining en data warehousing scheidt, dat wil zeggen dat data mining een proces is om betekenisvolle gegevens uit de grote database of het datawarehouse te extraheren. Datawarehouse biedt echter een omgeving waarin de gegevens worden opgeslagen in een geïntegreerde vorm die datamining vergemakkelijken om gegevens efficiënter te extraheren.

Gevolgtrekking:

Datamining kan alleen worden gedaan als er een goed geïntegreerde grote database is, d.w.z. datawarehouse. Dus datawarehouse moet voltooid zijn voordat data mining. Datawarehouse moet informatie in een goed geïntegreerde vorm hebben, zodat datamining de kennis op een efficiënte manier kan extraheren.