Wikipedia po i jep të dhëna zhvilluesve AI që të mbrohet nga mbledhësit automatik

Teknologji

Wikipedia po i jep të dhëna zhvilluesve AI që të mbrohet nga mbledhësit automatik

Më: 17 prill 2025 Në ora: 15:58
Foto ilustrim

Wikipedia po tenton të dekurajojë zhvilluesit e inteligjencës artificiale nga grumbullimi i të dhënave nga platforma duke publikuar një set të të dhënave që është specifikisht i optimizuar për trajnimin e modeleve të AI, raporton The Verge.

Fondacioni Wikimedia njoftoi të mërkurën se kishte bërë partneritet me Kaggle — një platformë të komunitetit të shkencës së të dhënave, që është në pronësi të Google, për të publikuar një dataset beta të “përmbajtjes së strukturuar të Wikipedia-s në anglisht dhe frëngjisht”.

Wikimedia thotë se dataset-i i akomoduar në Kaggle është “projektuar me proceset e punës të mësimit të makinerisë në mendje”, duke e bërë më të lehtë për zhvilluesit e AI të kenë qasje në të dhënat e artikujve që mund të lexohen nga makinat për modelimin, rregullimin, krahasimin, përputhshmërinë dhe analizën. Përmbajtja brenda dataset-it është me licencë të hapur dhe, që nga 15 prilli, përfshin përmbledhje kërkimore, përshkrime të shkurtra, lidhje imazhesh, të dhëna të infobox-it dhe seksione artikujsh — pa përfshirë referencat ose elementet pa shkrim, si skedarët e audio-ve.

“Përfaqësimet JSON të strukturuara mirë të përmbajtjes së Wikipedia-s” që janë të disponueshme për përdoruesit e Kaggle duhet të jenë një alternativë më tërheqëse për “grumbullimin ose analizimin e tekstit të pastër të artikujve”, sipas Wikimedia-s — një çështje që aktualisht po shkakton stres tek serverët e Wikipedia-s pasi robotët automatizuar të AI konsumojnë pa pushim gjerësinë e bandës së platformës. Wikimedia ka tashmë marrëveshje për ndarjen e përmbajtjes me Google dhe Internet Archive, por partneriteti me Kaggle duhet ta bëjë këtë të dhëna më të qasshme për kompani më të vogla dhe shkencëtarë të të dhënave të pavarur.

“Si vendi ku komuniteti i mësimit të makinerisë vjen për mjete dhe teste, Kaggle është jashtëzakonisht i emocionuar të jetë mikpritës për të dhënat e Fondacionit Wikimedia”, tha Brenda Flynn, udhëheqëse e partneriteteve të Kaggle. “Kaggle është e emocionuar të luajë një rol në mbajtjen e këtyre të dhënave të qasshme, të disponueshme dhe të dobishme”.

comment Për komente lëvizni më poshtë
Sot mund të lexoni Shfletoni kopertinat