GitHub подключается к тренду и будет обучать ИИ на ваших данных

GitHub обновил политику использования данных для улучшения функций искусственного интеллекта в разработке. С 24 апреля данные взаимодействия пользователей бесплатного Copilot, а также версий Pro и Pro+ могут применяться для обучения и совершенствования моделей GitHub, если пользователи не откажутся от этого. На пользователей Copilot Business и Copilot Enterprise это изменение не распространяется.

Пользователи, которые уже оформили отказ, могут не предпринимать дополнительных действий — их настройки остаются в силе.

Если пользователи согласны участвовать, GitHub может применять данные взаимодействия для повышения качества работы моделей. Это включает лучшее понимание рабочих процессов разработки, формирование более точных предложений кода и раннее выявление потенциальных проблем.

Ранее GitHub обучал свои модели на общедоступных данных и отобранных примерах кода. Теперь компания, где это разрешено, использует для доработки моделей данные о взаимодействии пользователей.

Компания может собирать запросы, отправленные в Copilot, сгенерированные предложения, принятые или изменённые результаты, контекст кода, комментарии и документацию, имена файлов, структуру репозиториев и отзывы на предложения. Эти данные поддерживают работу сервиса и, если пользователь разрешил, обучение моделей.

Данные взаимодействия от пользователей Copilot Business и Enterprise, от пользователей, оформивших отказ, а также из репозиториев, принадлежащих предприятиям, для обучения не используются. GitHub заявляет, что содержимое приватных репозиториев, issues и обсуждений «в состоянии покоя» не применяется для обучения моделей. Copilot обрабатывает код во время использования для формирования предложений, и данные этих взаимодействий могут быть использованы для обучения только если пользователь не отказался от этого.

Компания может передавать данные, применяемые для улучшения моделей, своим аффилированным лицам, включая Microsoft. Независимым сторонним поставщикам моделей ИИ эти данные не передаются.

«Мы уверены, что будущее разработки с помощью ИИ зависит от реальных данных взаимодействия таких разработчиков, как вы. Поэтому мы используем данные взаимодействия Microsoft для обучения моделей и начнём применять данные взаимодействия сотрудников GitHub», — заявил Марио Родригес, директор по продуктам GitHub.

«Если вы решите помочь нам улучшить наши модели своими данными взаимодействия — спасибо. Ваш вклад имеет большое значение для создания ИИ-инструментов, которые служат всему сообществу разработчиков. Если вы предпочитаете не участвовать — это тоже нормально, вы по-прежнему сможете в полной мере пользоваться всеми любимыми функциями ИИ», — подытожил Родригес.