[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: Index ueber Dateipool erzeugen


Am 18.11.2013 13:40, schrieb Christian Weisgerber:
> Juergen Roethig <jroethig@xxxxxx> wrote:
> 
> > Da hat offensichtlich jemand bei der Datenbank-Vorlesung nicht
> > aufgepasst ... ein Primaerschluessel _muss_ _immer_ _eindeutig_ sein,
> > eine Hash-Funktion (Checksumme ist eine solche) ist dies _nicht_ !
> 
> Wenn ich Raphael richtig verstanden habe, werden Dateien gleichen
> Inhalts nur einmal erfasst. Es ist ueblich, die mit einem krytografischen
> Hash ueber eine Datei ermittelte Pruefzahl als eindeutig zu behandeln,
> weil die Wahrscheinlichkeit einer Kollision _verschwindend_ gering
> ist. Das ist z.B. ein zentrales Konzept von verteilten Versionsverwaltungen
> wie Git.

Ja, die Frage ist einfach, was passiert, wenn eine Kollision auftritt.

Wird ein Leben ruiniert, stirbt ein Mensch oder wird nur eine Datei einer
Musiksammlung falsch oder gar nicht indiziert?

Vor ein paar Jahren wurde z.B. immer noch md5 benutzt, bis heraus kam, das
Kollisionen bei md5 gar nicht so unwahrscheinlich sind, wie angenommen.

D.h. auf das Problem hinweisen ist schon ok, es zu ignorieren auch. Kommt halt
darauf an was man macht und welche Konsequenzen eine Kollision hat.

Gruss,

Alexander


-- 
UUGRN e.V. http://www.uugrn.org/
http://mailman.uugrn.org/mailman/listinfo/uugrn
Wiki: https://wiki.uugrn.org/UUGRN:Mailingliste
Archiv: http://lists.uugrn.org/