Post Thumbnail

HuggingFace und IISc erstellen Sprachdatenbank Indiens

HuggingFace und das Indian Institute of Science (IISc) haben eine Partnerschaft angekündigt, die Vaani, den größten multimodalen und mehrsprachigen Datensatz Indiens, Entwicklern weltweit zugänglich machen wird. Das Projekt zielt darauf ab, inklusive KI-Technologien zu schaffen, die die sprachliche und kulturelle Vielfalt des Landes berücksichtigen.

Das Vaani-Projekt, das 2022 gemeinsam von IISc/ARTPARK und Google gestartet wurde, setzt sich ein ehrgeiziges Ziel: mehr als 150.000 Stunden Sprache und 15.000 Stunden transkribierter Text von 1 Million Menschen in allen 773 Bezirken Indiens zu sammeln. Die Einzigartigkeit des Projekts liegt in seinem geozentrischen Ansatz, der es ermöglicht, Daten über Dialekte und Sprachen zu sammeln, die in abgelegenen Regionen verwendet werden, nicht nur über Mainstream-Sprachen.

Gegenwärtig wird das Projekt in Phasen umgesetzt. Die erste Phase, die 80 Bezirke umfasst, ist bereits abgeschlossen, und die Daten sind öffentlich zugänglich. Die zweite Phase läuft jetzt und erweitert die Abdeckung um weitere 100 Bezirke.

Mit Stand vom 15. Februar 2025 umfasst der offene Teil des Datensatzes eine transkribierte Teilmenge mit 790 Stunden Audio von etwa 700.000 Sprechern und deckt 70.000 Bilder ab. Diese Ressource ist für verschiedene Aufgaben bestimmt, darunter:
– Spracherkennung: Training von Modellen für die genaue Transkription gesprochener Sprache
– Sprachmodellierung: Erstellung fortschrittlicherer Sprachmodelle
– Segmentierung: Identifizierung einzelner Spracheinheiten zur Verbesserung der Transkriptionsgenauigkeit

Die Partnerschaft zwischen HuggingFace und IISc/ARTPARK zielt darauf ab, die Zugänglichkeit und Benutzerfreundlichkeit des Vaani-Datensatzes zu erhöhen, was zur Entwicklung von KI-Systemen beitragen sollte, die die Vielfalt der indischen Sprachen besser verstehen und den digitalen Bedürfnissen der Bevölkerung des Landes gerecht werden.

Dieses Projekt stellt einen wichtigen Schritt bei der Demokratisierung von KI-Technologien und der Schaffung inklusiverer Lösungen dar, die die sprachliche Vielfalt eines der größten Länder der Welt berücksichtigen.

Autor: AIvengo
Seit 5 Jahren arbeite ich mit maschinellem Lernen und künstlicher Intelligenz. Und dieser Bereich hört nicht auf, mich zu überraschen, zu begeistern und zu interessieren.
Latest News
IWF-Chefökonom verglich KI-Boom mit Dotcom-Blase

IWF-Chefökonom Pierre-Olivier Gourinchas erklärte, dass die Welt bereits die Hälfte des Weges bis zur geplatzten KI-Blase und einer neuen Finanzkrise zurückgelegt hat.

Forscher knackten 12 KI-Schutzsysteme

Wissen Sie, was Forscher von OpenAI, Anthropic, Google DeepMind und Harvard gerade herausgefunden haben? Sie versuchten, beliebte KI-Sicherheitssysteme zu knacken und fanden fast überall eine Umgehung. Sie überprüften 12 verbreitete Schutzansätze. Von intelligenten System-Prompt-Formulierungen bis zu externen Filtern, die gefährliche Anfragen abfangen sollen.

OpenAI hat 5 Jahre um $13 Milliarden in Billion zu verwandeln

Wissen Sie, in welcher Position sich OpenAI jetzt befindet? Laut Financial Times hat das Unternehmen 5 Jahre, um 13 Milliarden Dollar in eine Billion zu verwandeln. Und so sieht es in der Praxis aus.

Sam Altman verspricht, Menschlichkeit in ChatGPT zurückzubringen

OpenAI-Chef Sam Altman machte Erklärung nachdem es zahlreiche Offline- und Online-Proteste gegen Abschaltung des GPT-4o-Modells gab. Und dann Einschaltung, aber mit wildem Router. Ich erzählte darüber letzte Woche maximal ausführlich. Direktes Zitat des OpenAI-Chefs.

KI erwacht zum Leben: Warum Anthropic-Mitgründer seine Schöpfung fürchtet

Anthropic-Mitgründer Jack Clark veröffentlichte ein Essay, das einem unbehaglich wird. Er schrieb über die Natur moderner künstlicher Intelligenz, und seine Schlussfolgerungen klingen wie eine Warnung.