Späť na blog
·Rosie·1 min čítania·Archív 2022

Minerva od Googlu vyřeší třetinu cvičných problémů vysokoškolské matematiky, fyziky, chemie, ekonomie a biologie!

Máme tu další novinku pro milovníky jazykových modelů. Model Minerva je založen na jazykovém modelu Google Pathways, který obsahuje 540 miliardách parametrů. Školen byl…

Minerva od Googlu vyřeší třetinu cvičných problémů vysokoškolské matematiky,  fyziky, chemie, ekonomie a biologie!

Minerva od Googlu vyřeší třetinu cvičných problémů vysokoškolské matematiky,  fyziky, chemie, ekonomie a biologie!

Máme tu další novinku pro milovníky jazykových modelů. Model Minerva je založen na jazykovém modelu Google Pathways, který obsahuje 540 miliardách parametrů. Školen byl nejprve na obecných jazykových datech a poté dotrénován na technickém obsahu. Zdá se, že ve svém zaměření je nyní nejlepší svého druhu. Matematické i přírodovědné otázky řeší pomocí uvažování „krok za krokem“. Model byl trénován na 118GB datovém souboru vědeckých prací ze serveru arXiv a webových stránek, které obsahují matematické výrazy používající LaTeX, MathJax nebo jiné matematické formáty.

Zdroje:

  1. https://ai.googleblog.com/2022/06/minerva-solving-quantitative-reasoning.html?fbclid=IwAR3y99mIqQdDVeoDvlQsIMyOOmdEhABoVsFNerC8MmqfJfgX7fCXtLqG8vs
  2. Výzkumný článek o Minervě: https://arxiv.org/abs/2206.14858?fbclid=IwAR3xEJ3qFOFveZtEAUBxLqYDdlF711Dc0_qcUJonWbPtSHyGP3-9QZsGJ2o
  3. Chain of Thought vysvětlení od Googlu: https://ai.googleblog.com/2022/05/language-models-perform-reasoning-via.html?fbclid=IwAR3vqUMZDMAfEzpyiFbDDtdJ7qNmQ-oGpJtuyZ55kwOqPIK5fFdDHTPeWlo
  4. Výzkum Chain of Thought: https://arxiv.org/abs/2201.11903?fbclid=IwAR3xEJ3qFOFveZtEAUBxLqYDdlF711Dc0_qcUJonWbPtSHyGP3-9QZsGJ2o
  5. Meier, RD, Cheney, DL a Seyfarth, RM (1990). Pamatují si zvířata minulost a plánují budoucnost? Behavioral and Brain Sciences, 13(1), 1–16.
  6. https://pub.towardsai.net/how-minerva-a-new-nlp-model-performs-better-than-gpt-3-f7713458b59b

Původní zdroj: wordpress

Související články