DatologyAI získává 46 milionů dolarů na zefektivnění tréninkových datových diet modelu AI

DatologyAI získává 46 milionů dolarů na zefektivnění tréninkových datových diet modelu AI

Startup DatologyAI zabývající se kurací dat umělé inteligence dnes oznámil, že uzavřel počáteční fázi financování ve výši 46 milionů dolarů, které přichází jen tři měsíce poté, co poprvé oznámil, že získal počáteční financování ve výši 11,65 milionů dolarů.

Společnost uvedla, že dnešní kolo série A vedly Viv Faga a Astasia Myers z Felicis Ventures a viděli účast stávajících investorů včetně Radical Ventures a Amplify Partners a nových investorů, jako jsou Elad Gil, M12 a Amazon Alexa Fund. Celkově vzato, DatologyAI nyní získala téměř 57,7 milionu dolarů na financování.

Podle startupu je jeho cílem demokratizovat výzkum dat a pokusit se vyřešit jeden z hlavních problémů vývoje generativní umělé inteligence: potřebu spravovat extrémně velké a vhodné datové sady, které informují velké jazykové modely, jako je OpenAI GPT-4 a Gemini Pro od Google LLC. .

DatologyAI poskytuje nástroje, které mohou pomoci zautomatizovat velkou část práce spojené s vytvářením těchto datových sad. Funguje tak, že identifikuje, které informace v rámci datové sady jsou nejvhodnější, na základě toho, k čemu je model AI navržen. Kromě toho mohou jeho nástroje navrhovat způsoby, jak rozšířit existující datové sady o další informace, vypracovat nejlepší způsob, jak tyto informace dávkovat, nebo je rozdělit do lépe spravovatelných částí, aby se zjednodušil proces trénování modelu.

Startup říká, že je náročné vytvářet datové sady pro generativní umělou inteligenci, protože vývojáři musí být opatrní, aby jejich modely nezačaly chrlit toxický obsah nebo nevykazovaly předsudky, které jsou přímým důsledkem obsahu, na kterém jsou školeni. Problém je v tom, že v datech mohou existovat škodlivé vzorce, které je pro lidi obtížné odhalit. Jedním z důvodů je to, že trénovací datové sady AI bývají obrovské a složité, s různými různými formáty a spoustou šumu a zbytečných informací, které model ve skutečnosti nezlepší.

„Modely jsou tím, co jedí, a požité datové modely určují vše o jejich schopnostech,“ vysvětlila společnost v krátkém příspěvku na blogu oznamujícím dnešní kolo.

Zakladatel a výkonný ředitel Ari Morcos říká, že pomocí efektivnějších tréninkových datových sad je možné zlepšit kvalitu a výkon modelů umělé inteligence, aniž by byly příliš velké a drahé na trénování a provoz, věří Morcos.

Menší modely umělé inteligence mají mnohem nižší výpočetní náklady, a to je klíčový faktor, protože některé společnosti využívající umělou inteligenci utrácejí miliony dolarů každý měsíc za školení a provoz svých modelů.

Výzvou pro vývojáře umělé inteligence je, že často mají tolik informací, že nevědí, kde začít, a místo aby se pokoušeli to vyřešit, jednoduše náhodně vyberou podmnožinu dostupných dat. To může ušetřit čas a námahu, ale také to nevyhnutelně znamená, že model je trénován na redundantních datech, což má za následek pomalejší tréninkové časy a vyšší náklady – nemluvě o skutečnosti, že některá z těchto dat mohou ovlivnit výkon modelu.

DatologyAI poskytuje nástroje, které umožňují vývojářům identifikovat nejužitečnější informace v rámci dané datové sady. Méně užitečné informace jsou poté odfiltrovány, čímž se vytvoří mnohem efektivnější soubor s kvalitnějšími vzorky, který je připraven pro trénink.

Sada nástrojů společnosti může také pomoci při označování neoznačených dat, což je pečlivá práce, která se běžně provádí ručně. Konečně je schopen identifikovat jakákoli data, která mohou být škodlivá nebo způsobit neočekávané chování modelu.

Startup uvedl, že dnešní kolo financování mu umožní „podstatně rozšířit velikost našeho týmu“ se zvláštním zaměřením na přidání dalších výzkumníků a inženýrů k jeho zaměstnancům. Chce také zvýšit svůj výpočetní výkon, aby „posunul hranici toho, co je možné při správě dat“.

Obrázek: SiliconANGLE/Microsoft Designer

Váš hlas pro podporu je pro nás důležitý a pomáhá nám zachovat obsah ZDARMA.

Jedním kliknutím níže podpoříte naše poslání poskytovat bezplatný, hluboký a relevantní obsah.

Připojte se k naší komunitě na YouTube

Připojte se ke komunitě, která zahrnuje více než 15 000 odborníků #CubeAlumni, včetně generálního ředitele Amazon.com Andyho Jassyho, zakladatele a generálního ředitele Dell Technologies Michaela Della, generálního ředitele Intelu Pata Gelsingera a mnoha dalších osobností a odborníků.

„TheCUBE je důležitým partnerem v oboru. Jste opravdu součástí našich akcí a my si opravdu vážíme toho, že jste přišli, a vím, že lidé oceňují i ​​obsah, který vytváříte.” – Andy Jassy

DĚKUJI

Leave a Reply

Your email address will not be published. Required fields are marked *