+ Post New Thread
Results 1 to 5 of 5
  1. #1
    Join Date
    12.12.2006
    Location
    Essen
    Age
    37
    Posts
    65
    Thanks
    Thanked 0 Times in 0 Posts

    Default Turbo für Tauschbörsen

    So beliebt sie auch sind: Filesharing-Netze im Internet sind eher langsam. Mehr als die Hälfte aller Transfers brechen ab und die Durchschnittsgeschwindigkeit für größere Dateien scheint nicht selten bei 24 Stunden pro 100 Megabyte zu liegen – je nachdem, wie populär und verbreitet eine Datei ist. Himabindu Pucha von der Purdue University und David Andersen von der Carnegie Mellion University wollen die Technologie deshalb deutlich verbessern. Die Computerwissenschaftler glauben, die Geschwindigkeit nahezu verdoppeln zu können, in dem sie sich überlappende Dateibereiche nutzen, die in eigentlich nicht ganz identischen Multimedia-Dateien sitzen. Dies würde auch die Erfolgsaussichten erhöhen, dass ein Transfer tatsächlich erfolgreich abgeschlossen wird.

    Filesharing-Netze wie BitTorrent oder Kazaa machen es möglich, dass sich Nutzer einzelne Dateien von den Rechnern anderer Teilnehmer herunterladen. Eine passende Kopie wird dabei über einen so genannten Hash-Wert angefordert, der einzigartig ist und aus der Datensequenz einer Datei gebildet wird. Anschließend wird das gewünschte File in verschiedene Stücke zerlegt, so dass jeder teilnehmende Rechner nur einen kleinen Teil der Datei weitergeben muss.

    Diese Technik macht den Transfer schneller, weil die meisten Internet-Benutzer zuhause geringere Upload- als Download-Bandbreiten zur Verfügung haben und sich das Hochladen so besser verteilt. Die Gesamtgeschwindigkeit hängt aber immer auch von der Anzahl an Quellen ab, die es für eine Datei gibt: Je populärer sie ist, desto schneller lässt sie sich herunterladen und der Download tatsächlich erfolgreich beenden.
    Anzeige

    Andersen und Pucha wollen nun die Größe des Pools möglicher Dateiquellen zu erhöhen. Das dabei verwendete Verfahren nennt sich "Similarity-Enhanced Transfer", kurz SET. Die Technik nutzt die Tatsache aus, dass in vielen Filesharing-Netzen diverse Varianten der gleichen Musik-Dateien, Video-Clips oder Software-Titel verfügbar sind. "Wir hoffen, dass SET den Nutzern Zugriff auf eine größere Anzahl von Rechnern gibt, von denen sie eine Datei herunterladen können", erklärt Andersen. So werde es auch leichter, Teilnehmer zu finden, die genügend freie Upload-Kapazität besitzen.

    "Vor der Untersuchung von Andersen und Pucha war nicht klar, wie viel Redundanz tatsächlich in den Filesharing-Netzen steckt und wie diese ausgenutzt werden kann", erklärt Cornell University-Computerwissenschaftler Emin Gün Sirer. Das SET-Team analysierte nun aber fast zwei Terabyte an Musik- und Video-Dateien und erkannte, dass ähnliche Dateien zu 20 bis 99 Prozent identische Inhalte aufwiesen. Bei Musikdateien reichte es bereits aus, dass Nutzer sich Fehler in den Metadaten erlauben, um das BitTorrent-Netz aus dem Takt zu bringen – obwohl 99 Prozent der Datei vollkommen identisch waren. Ähnlich sieht es bei Videos aus: Nicht selten sind die Bilder die gleichen, besitzen aber eine andere Tonspur.

    Die Herausforderung bestand nun darin, ähnliche Dateien auch korrekt zu verteilen. Dazu musste das SET-System nicht nur nach Dateinamen, sondern auch nach Ähnlichkeiten bei allen Dateiteilstücken suchen. Eine 700 Megabyte große Video-Datei wird nicht selten in 40.000 Teilstücke zerlegt, was bedeutet, dass SET eigentlich Milliarden von Vergleichsmessungen durchführen müsste. Deshalb arbeitet die Technik als Hybrid-System: Sie sucht zunächst nach Nutzern mit wirklich identischen Dateien, um dann die Teilstücke zu vergleichen.

    Um letzteres möglich schnell durchzuführen, setzten die Forscher auf ein Verfahren, das sich "Handabdruck" nennt: Dabei wird immer gleich häufig nach Übereinstimmungen gesucht, egal wie groß ein File ist. Dazu wird eine Datei in 16 Kilobyte große Teilstücke zerlegt, die sich dann wiederum in 160-Bit große Hash-Werte herunterrechnen lassen. Diese Fingerabdrücke werden dann nach ihrem numerischen Wert sortiert. Die ersten paar Werte bilden schließlich den Handabdruck. Vergleicht man diesen, erreicht man laut Andersen eine 90prozentige Chance, eine Datei zu erkennen, die mindestens zu 10 Prozent Ähnlichkeiten aufweist.

    Diese 10 Prozent würden die Download-Geschwindigkeit um mindestens 8 Prozent erhöhen, hat der Forscher errechnet. Bei Musikdateien mit mehr als 90 Prozent Ähnlichkeiten würde ein Download, der bei BitTorrent heute noch fünf Minuten dauert, nur noch zwei Minuten benötigen.

    Besonders bei Dateien, bei denen es sich um eine selten heruntergeladene Variante eines verbreiteten Files handelt, würde die Methode greifen. So könnte sich etwa ein US-Nutzer eine deutsche Version eines populären Filmes besorgen wollen. Aktuell muss er sich auf eine langsame Übersehverbindung verlassen. Dank SET kann er sich das Video jedoch in den USA laden und den Audio-Teil dann in Deutschland.

    "Das ist ein sehr cleveres Verfahren, um ähnliche Dateiteilstücke zu finden", meint Sirer. Allerdings helfe SET bei den populärsten Dateien nur wenig, weil dort schon genügend Quellen zur Verfügung stünden. "Ich kann mir allerdings vorstellen, dass andere Inhalte, die sonst sehr lange brauchen würden, leichter herunterzuladen sind."

    Der Quellcode für das SET-Verfahren liegt inzwischen vor. Allerdings haben Andersen und Pucha nicht vor, selbst ein grafisches Interface zu entwickeln oder SET in bestehende Filesharing-Netze zu integrieren. "Die Mathematik, die dahinter liegt, ist sehr komplex. Die Grundidee ist aber einfach genug, und eine Implementation dürfte nicht schwer sein", meint Andersen. Es würde ihn daher nicht überraschen, so der Forscher, wenn SET im nächsten Jahr in einem der großen Filesharing-Netze auftauchen würde.

    Quelle


    heisse.de

  2. #2
    Join Date
    07.11.2001
    Location
    Deizisau
    Posts
    47,141
    Thanks
    Thanked 782 Times in 612 Posts

    Default

    Coole Idee. Das wird die Geschwindigkeit sicherlich nochmal deutlich erhöhen.
    This is my rabbit. Copy rabbit into your signature to help him on his way to world domination.

  3. #3
    Join Date
    13.06.2003
    Location
    Bremen
    Age
    42
    Posts
    11,811
    Thanks
    Thanked 340 Times in 243 Posts

    Default

    ...und die Durchschnittsgeschwindigkeit für größere Dateien scheint nicht selten bei 24 Stunden pro 100 Megabyte...
    rofl, wo saugen die denn?

  4. #4
    Join Date
    07.11.2001
    Location
    Deizisau
    Posts
    47,141
    Thanks
    Thanked 782 Times in 612 Posts

    Default

    hab ich mir auch überlegt
    This is my rabbit. Copy rabbit into your signature to help him on his way to world domination.

  5. #5
    Join Date
    19.04.2006
    Location
    Hamburg, Germany
    Age
    33
    Posts
    7,601
    Thanks
    Thanked 184 Times in 148 Posts

    Default

    Mhm ich weiß ja nicht, inzwischen finde ich sowas unnötig. Aber für das künftige Saugen der neusten Ubuntu Version sollte es perfekt sein!
    RFC 1925 / 2.7a:
    "Good, Fast, Cheap: Pick any two (you can't have all three)."

Thread Information

Users Browsing this Thread

There are currently 1 users browsing this thread. (0 members and 1 guests)

Posting Permissions

  • You may not post new threads
  • You may not post replies
  • You may not post attachments
  • You may not edit your posts
  •