13 terabytes de dades dús públic per a laprenentatge de màquines
La multinacional Yahoo ha posat tretze terabytes de dades anònimes d’ús públic a l’abast dels desenvolupadors que treballen en aplicacions corresponents a l’aprenentatge de màquines. El conjunt de dades provenen de la pàgina principal de Yahoo, Yahoo News, Yahoo Sports, Yahoo Finance, Yahoo Movies i Yahoo Real Estate.
A banda de les dades interactives, Yahoo dóna un rang d’informació demogràfica categoritzada per un subconjunt d’usuaris anònims. Aquests valors demogràfics inclouen edat, rang, gènere i dades geogràfiques. Pel que fa al conjunt de dades, estarà disponible el títol, un breu sumari i paraules clau dels articles de notícies. Les dades interactives també tenen data i hora i informació sobre els dispositius emprats en les interaccions. Suju Rajan, membre de Yahoo Labs, defensa que “això permet fer un treball interessant amb recomanacions contextuals i promoure la investigació independent en el camp de l’aprenentatge de màquines a gran escala i ajudar a incrementar el nivell d’interacció entre la investigació acadèmica i la indústria”.
Yahoo preveu que aquestes dades siguin utilitzades per investigadors, científics de dades i entusiastes de l’aprenentatge de màquines a l’acadèmia que necessiten conjunts de dades del món real.
TEXT: REDACCIÓ // FOTOGRAFIA: IMATGE D’ARXIU