PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Turbo für Tauschbörsen



MaUs
03.05.2007, 11:07
So beliebt sie auch sind: Filesharing-Netze im Internet sind eher langsam. Mehr als die Hälfte aller Transfers brechen ab und die Durchschnittsgeschwindigkeit für größere Dateien scheint nicht selten bei 24 Stunden pro 100 Megabyte zu liegen – je nachdem, wie populär und verbreitet eine Datei ist. Himabindu Pucha von der Purdue University und David Andersen von der Carnegie Mellion University wollen die Technologie deshalb deutlich verbessern. Die Computerwissenschaftler glauben, die Geschwindigkeit nahezu verdoppeln zu können, in dem sie sich überlappende Dateibereiche nutzen, die in eigentlich nicht ganz identischen Multimedia-Dateien sitzen. Dies würde auch die Erfolgsaussichten erhöhen, dass ein Transfer tatsächlich erfolgreich abgeschlossen wird.

Filesharing-Netze wie BitTorrent oder Kazaa machen es möglich, dass sich Nutzer einzelne Dateien von den Rechnern anderer Teilnehmer herunterladen. Eine passende Kopie wird dabei über einen so genannten Hash-Wert angefordert, der einzigartig ist und aus der Datensequenz einer Datei gebildet wird. Anschließend wird das gewünschte File in verschiedene Stücke zerlegt, so dass jeder teilnehmende Rechner nur einen kleinen Teil der Datei weitergeben muss.

Diese Technik macht den Transfer schneller, weil die meisten Internet-Benutzer zuhause geringere Upload- als Download-Bandbreiten zur Verfügung haben und sich das Hochladen so besser verteilt. Die Gesamtgeschwindigkeit hängt aber immer auch von der Anzahl an Quellen ab, die es für eine Datei gibt: Je populärer sie ist, desto schneller lässt sie sich herunterladen und der Download tatsächlich erfolgreich beenden.
Anzeige

Andersen und Pucha wollen nun die Größe des Pools möglicher Dateiquellen zu erhöhen. Das dabei verwendete Verfahren nennt sich "Similarity-Enhanced Transfer", kurz SET. Die Technik nutzt die Tatsache aus, dass in vielen Filesharing-Netzen diverse Varianten der gleichen Musik-Dateien, Video-Clips oder Software-Titel verfügbar sind. "Wir hoffen, dass SET den Nutzern Zugriff auf eine größere Anzahl von Rechnern gibt, von denen sie eine Datei herunterladen können", erklärt Andersen. So werde es auch leichter, Teilnehmer zu finden, die genügend freie Upload-Kapazität besitzen.

"Vor der Untersuchung von Andersen und Pucha war nicht klar, wie viel Redundanz tatsächlich in den Filesharing-Netzen steckt und wie diese ausgenutzt werden kann", erklärt Cornell University-Computerwissenschaftler Emin Gün Sirer. Das SET-Team analysierte nun aber fast zwei Terabyte an Musik- und Video-Dateien und erkannte, dass ähnliche Dateien zu 20 bis 99 Prozent identische Inhalte aufwiesen. Bei Musikdateien reichte es bereits aus, dass Nutzer sich Fehler in den Metadaten erlauben, um das BitTorrent-Netz aus dem Takt zu bringen – obwohl 99 Prozent der Datei vollkommen identisch waren. Ähnlich sieht es bei Videos aus: Nicht selten sind die Bilder die gleichen, besitzen aber eine andere Tonspur.

Die Herausforderung bestand nun darin, ähnliche Dateien auch korrekt zu verteilen. Dazu musste das SET-System nicht nur nach Dateinamen, sondern auch nach Ähnlichkeiten bei allen Dateiteilstücken suchen. Eine 700 Megabyte große Video-Datei wird nicht selten in 40.000 Teilstücke zerlegt, was bedeutet, dass SET eigentlich Milliarden von Vergleichsmessungen durchführen müsste. Deshalb arbeitet die Technik als Hybrid-System: Sie sucht zunächst nach Nutzern mit wirklich identischen Dateien, um dann die Teilstücke zu vergleichen.

Um letzteres möglich schnell durchzuführen, setzten die Forscher auf ein Verfahren, das sich "Handabdruck" nennt: Dabei wird immer gleich häufig nach Übereinstimmungen gesucht, egal wie groß ein File ist. Dazu wird eine Datei in 16 Kilobyte große Teilstücke zerlegt, die sich dann wiederum in 160-Bit große Hash-Werte herunterrechnen lassen. Diese Fingerabdrücke werden dann nach ihrem numerischen Wert sortiert. Die ersten paar Werte bilden schließlich den Handabdruck. Vergleicht man diesen, erreicht man laut Andersen eine 90prozentige Chance, eine Datei zu erkennen, die mindestens zu 10 Prozent Ähnlichkeiten aufweist.

Diese 10 Prozent würden die Download-Geschwindigkeit um mindestens 8 Prozent erhöhen, hat der Forscher errechnet. Bei Musikdateien mit mehr als 90 Prozent Ähnlichkeiten würde ein Download, der bei BitTorrent heute noch fünf Minuten dauert, nur noch zwei Minuten benötigen.

Besonders bei Dateien, bei denen es sich um eine selten heruntergeladene Variante eines verbreiteten Files handelt, würde die Methode greifen. So könnte sich etwa ein US-Nutzer eine deutsche Version eines populären Filmes besorgen wollen. Aktuell muss er sich auf eine langsame Übersehverbindung verlassen. Dank SET kann er sich das Video jedoch in den USA laden und den Audio-Teil dann in Deutschland.

"Das ist ein sehr cleveres Verfahren, um ähnliche Dateiteilstücke zu finden", meint Sirer. Allerdings helfe SET bei den populärsten Dateien nur wenig, weil dort schon genügend Quellen zur Verfügung stünden. "Ich kann mir allerdings vorstellen, dass andere Inhalte, die sonst sehr lange brauchen würden, leichter herunterzuladen sind."

Der Quellcode für das SET-Verfahren liegt inzwischen vor. Allerdings haben Andersen und Pucha nicht vor, selbst ein grafisches Interface zu entwickeln oder SET in bestehende Filesharing-Netze zu integrieren. "Die Mathematik, die dahinter liegt, ist sehr komplex. Die Grundidee ist aber einfach genug, und eine Implementation dürfte nicht schwer sein", meint Andersen. Es würde ihn daher nicht überraschen, so der Forscher, wenn SET im nächsten Jahr in einem der großen Filesharing-Netze auftauchen würde.

Quelle

heisse.de (http://www.heise.de/tr/artikel/88819)

Voodoo
03.05.2007, 11:34
Coole Idee. Das wird die Geschwindigkeit sicherlich nochmal deutlich erhöhen.

MaX PoWeR
03.05.2007, 19:10
...und die Durchschnittsgeschwindigkeit für größere Dateien scheint nicht selten bei 24 Stunden pro 100 Megabyte...
rofl, wo saugen die denn? :ugly:

Voodoo
03.05.2007, 19:14
hab ich mir auch überlegt :)

Deadman
03.05.2007, 21:54
Mhm ich weiß ja nicht, inzwischen finde ich sowas unnötig. Aber für das künftige Saugen der neusten Ubuntu Version sollte es perfekt sein!