Download e-book for iPad: Partitionierung zur effizienten Duplikaterkennung in by Uwe Draisbach

By Uwe Draisbach

Duplikate bzw. Dubletten sind mehrere Datensätze, die das gleiche Realweltobjekt beschreiben, etwa mehrfach erfasste Kunden in einem CRM-System oder unterschiedliche Repräsentationen eines Produkts. Das Auffinden dieser Duplikate ist auch für moderne computing device eine komplexe und zeitintensive Aufgabe. Uwe Draisbach vergleicht zwei der einschlägigen Partitionierungsstrategien, die eine intelligente Auswahl von zu vergleichenden Datensatzpaaren treffen. Daraus entwickelt er ein verallgemeinertes Verfahren und zeigt, dass eine intelligente Auswahl der Datensatzpaare den Aufwand signifikant reduzieren kann, ohne die Qualität der Duplikaterkennung wesentlich zu verringern.

 

Die Arbeit wurde mit dem „Information caliber most sensible grasp measure Award“ der Deutschen Gesellschaft für Informations- und Datenqualität ausgezeichnet.

Show description

Read Online or Download Partitionierung zur effizienten Duplikaterkennung in relationalen Daten (Ausgezeichnete Arbeiten zur Informationsqualität) (German Edition) PDF

Similar computing, internet & digital media in german books

Download PDF by Rochus Stobbe: Dokumentenmanagement mit ECMS (German Edition)

Studienarbeit aus dem Jahr 2011 im Fachbereich Informatik - Wirtschaftsinformatik, be aware: 1,7, FOM Hochschule für Oekonomie & administration gemeinnützige GmbH, Frankfurt früher Fachhochschule (FOM), Veranstaltung: content material administration Systeme, Sprache: Deutsch, summary: Dokumentenmanagement ist derzeit in aller Munde.

Download e-book for iPad: Vor- und Nachteile von Cloud Computing (German Edition) by Marcus Forschepoth,Anne Frischbier

Studienarbeit aus dem Jahr 2011 im Fachbereich Informatik - Wirtschaftsinformatik, notice: 1,7, Technische Fachhochschule Wildau, Veranstaltung: Strategisches IT-Management, Sprache: Deutsch, summary: Das Thema Cloud Computing ist ein derzeit sehr aktuelles Thema, das bei Unternehmen und Privatnutzern eine immer größer werdende Bedeutung zukommt.

Download e-book for iPad: Konzeption eines Standardprozesses zur by Wolfgang Theophil

Bachelorarbeit aus dem Jahr 2012 im Fachbereich Informatik - Wirtschaftsinformatik, word: 2. zero, FOM Hochschule für Oekonomie & administration gemeinnützige GmbH, Dortmund früher Fachhochschule, Sprache: Deutsch, summary: Das vorliegende Werk beschreibt anschaulich und vollständig, wie ein Standardprozess für die Digitalisierung von Dokumenten aufgebaut werden kann.

Get Die Kundenrolle in IT-Projekten (German Edition) PDF

In Informatikprojekten sollte der Kunde im Zentrum stehen. Dazu muss der Kunde im Projekt aktiv und gestaltend tätig werden. Dieses Buch hilft Ihnen, als Kunde in einem Projekt das optimal herauszuholen. Es ermöglicht Ihnen, sich in dieser state of affairs zurechtzufinden. Es zeigt Ihnen, wie Sie erfolgreich mit Informatikern und Projektleitern auskommen.

Additional resources for Partitionierung zur effizienten Duplikaterkennung in relationalen Daten (Ausgezeichnete Arbeiten zur Informationsqualität) (German Edition)

Example text

Download PDF sample

Partitionierung zur effizienten Duplikaterkennung in relationalen Daten (Ausgezeichnete Arbeiten zur Informationsqualität) (German Edition) by Uwe Draisbach


by Donald
4.1

Rated 5.00 of 5 – based on 27 votes