MÜNCHEN (IT BOLTWISE) – Wikipedia hat einen bedeutenden Schritt unternommen, um die Entwicklung von Künstlicher Intelligenz zu unterstützen, indem es speziell aufbereitete Datensätze für KI-Entwickler bereitstellt. Diese Initiative, die über das Google-Projekt Kaggle verfügbar ist, zielt darauf ab, den Zugang zu strukturierten und maschinenlesbaren Inhalten zu erleichtern.
Wikipedia, die weltweit größte Online-Enzyklopädie, hat kürzlich angekündigt, dass sie KI-Entwicklern speziell aufbereitete Datensätze zur Verfügung stellt. Diese Datensätze sind zunächst nur für die englische und französische Sprachversion verfügbar und sollen den Zugang zu sauberen, vorgeparsten Artikeldaten erleichtern. Diese Daten können direkt für Modellierung, Benchmarking und explorative Analysen genutzt werden, ohne dass Entwickler die Inhalte selbst extrahieren müssen.
Das kommerzielle Angebot der Wikimedia Stiftung, Wikimedia Enterprise, hat diese Datensätze über das Google-Projekt Kaggle bereitgestellt. Die englischsprachige Version umfasst rund 80 Gigabyte an Daten, die in Segmente von jeweils 2,15 GB aufgeteilt wurden, während der französische Datensatz etwa 34 GB groß ist. Diese Initiative soll die Arbeit von KI-Entwicklern erheblich erleichtern, indem sie Zugang zu gut strukturierten JSON-Darstellungen von Wikipedia-Inhalten bietet.
Wikimedia betont, dass es keine triviale Aufgabe ist, das in Wikipedia enthaltene Wissen maschinenlesbar zu extrahieren. Die verschiedenen Projekte, Sprachen und Domänen verfügen über ihre eigenen Experten und ihre eigene Art der Datenstrukturierung. Die Datensätze basieren auf der Betaversion der strukturierten Inhalte der Snapshot-API, die Wikimedia-Projektdaten in einem entwicklerfreundlichen Format ausgibt.
Da alle Inhalte aus Wikipedia stammen, sind sie unter den Lizenzen CC-BY-SA 4.0 oder GFDL frei verwendbar. In einigen Fällen könnten auch Public-Domain- oder alternative Lizenzen gelten. Wikimedia verlangt von den Nutzern des Datensatzes, dass sie die Erwartungen an eine ordnungsgemäße Namensnennung erfüllen. In Fällen, in denen eine Namensnennung erforderlich ist, sollten Weiterverwender das Wikimedia-Projekt, aus dem der Inhalt stammt, als Quelle angeben.
Diese Entwicklung könnte weitreichende Auswirkungen auf die KI-Entwicklung haben, da sie den Zugang zu hochwertigen, strukturierten Daten erheblich vereinfacht. Experten sehen darin einen wichtigen Schritt, um die Effizienz und Genauigkeit von KI-Modellen zu verbessern. Die Bereitstellung solcher Daten könnte auch die Innovationskraft in der KI-Forschung und -Entwicklung stärken, indem sie den Zugang zu umfangreichen und vielfältigen Datenquellen erleichtert.
In Zukunft könnte diese Initiative auf weitere Sprachversionen ausgeweitet werden, was die globale KI-Entwicklung weiter vorantreiben würde. Die Möglichkeit, auf strukturierte Wikipedia-Daten zuzugreifen, könnte auch neue Anwendungen und Forschungsergebnisse in der KI-Community inspirieren. Insgesamt stellt diese Entwicklung einen bedeutenden Fortschritt in der Bereitstellung von Daten für die KI-Entwicklung dar.
- Die besten Bücher rund um KI & Robotik!
- Die besten KI-News kostenlos per eMail erhalten!
- Zur Startseite von IT BOLTWISE® für aktuelle KI-News!
- Service Directory für AI Adult Services erkunden!
- IT BOLTWISE® kostenlos auf Patreon unterstützen!
- Aktuelle KI-Jobs auf StepStone finden und bewerben!
Stellenangebote

KI-Spezialist (m/w/d) für industrielle Anwendungen

IT Solution Architekt AI (w/m/d)

Duales Studium BWL - Spezialisierung Artificial Intelligence (B.A.) am Campus oder virtuell

Werkstudent*in Projektmanagement im Bereich KI (m/w/d)

- Die Zukunft von Mensch und MaschineIm neuen Buch des renommierten Zukunftsforschers und Technologie-Visionärs Ray Kurzweil wird eine faszinierende Vision der kommenden Jahre und Jahrzehnte entworfen – eine Welt, die von KI durchdrungen sein wird
- Künstliche Intelligenz: Expertenwissen gegen Hysterie Der renommierte Gehirnforscher, Psychiater und Bestseller-Autor Manfred Spitzer ist ein ausgewiesener Experte für neuronale Netze, auf denen KI aufbaut
- Obwohl Künstliche Intelligenz (KI) derzeit in aller Munde ist, setzen bislang nur wenige Unternehmen die Technologie wirklich erfolgreich ein
- Wie funktioniert Künstliche Intelligenz (KI) und gibt es Parallelen zum menschlichen Gehirn? Was sind die Gemeinsamkeiten von natürlicher und künstlicher Intelligenz, und was die Unterschiede? Ist das Gehirn nichts anderes als ein biologischer Computer? Was sind Neuronale Netze und wie kann der Begriff Deep Learning einfach erklärt werden?Seit der kognitiven Revolution Mitte des letzten Jahrhunderts sind KI und Hirnforschung eng miteinander verflochten
Du hast einen wertvollen Beitrag oder Kommentar zum Artikel "Wikipedia bietet strukturierte Datensätze für KI-Entwicklung" für unsere Leser?
Es werden alle Kommentare moderiert!
Für eine offene Diskussion behalten wir uns vor, jeden Kommentar zu löschen, der nicht direkt auf das Thema abzielt oder nur den Zweck hat, Leser oder Autoren herabzuwürdigen.
Wir möchten, dass respektvoll miteinander kommuniziert wird, so als ob die Diskussion mit real anwesenden Personen geführt wird. Dies machen wir für den Großteil unserer Leser, der sachlich und konstruktiv über ein Thema sprechen möchte.
Du willst nichts verpassen?
Du möchtest über ähnliche News und Beiträge wie "Wikipedia bietet strukturierte Datensätze für KI-Entwicklung" informiert werden? Neben der E-Mail-Benachrichtigung habt ihr auch die Möglichkeit, den Feed dieses Beitrags zu abonnieren. Wer natürlich alles lesen möchte, der sollte den RSS-Hauptfeed oder IT BOLTWISE® bei Google News wie auch bei Bing News abonnieren.
Nutze die Google-Suchmaschine für eine weitere Themenrecherche: »Wikipedia bietet strukturierte Datensätze für KI-Entwicklung« bei Google Deutschland suchen, bei Bing oder Google News!