Эта модель включает 32 миллиарда параметров и обучена на 10 ГБ профильных материалов, сопоставимых по объему с половиной англоязычной Википедии. В компании отмечают, что в отличие от универсальных систем MetalGPT-1 ориентирована на отраслевую терминологию и сложные технологические цепочки, что снижает риск ошибок и повышает надежность рекомендаций искусственного интеллекта.
В качестве ключевого преимущества разработчики выделяют качество обучающих данных. Обучение проводилось на массиве из более чем миллиона документов, которые не присутствуют в открытом доступе. В этот массив входили технологические протоколы, внутренние регламенты, проектная документация, патенты и отчеты о научно-исследовательских и опытно-конструкторских работах (НИОКР). Все материалы прошли многоступенчатую очистку и анонимизацию. Дополнительно подготовлено около 500 тысяч пар вопросов и инструкций, основанных на реальных производственных и научных задачах. MetalGPT-1 стала первой моделью компании с открытым исходным кодом.
Руководитель направления по развитию искусственного интеллекта компании «Норникель» Данил Ивашечкин заявил, что MetalGPT-1 является первой в мире отраслевой моделью на 32 миллиардах параметров, оптимизированной специально для металлургии, и показала высокий уровень понимания профессионального языка на отраслевых тестах.
«Норникель» (до 2016 года — «Норильский никель») является крупной горно-металлургической компанией, производящей палладий и высокосортный никель. Основными акционерами выступают «Интеррос» Владимира Потанина (37%) и «Русал» (26,39%) Олега Дерипаски.
