Источники информации для обучения искусственного интеллекта могут иссякнуть в ближайшем будущем



Недавние исследования показывают, что компании, занимающиеся разработкой ИИ, могут столкнуться с нехваткой текстовых данных для создания моделей машинного обучения.



Эксперты предсказывают, что даже продвинутые модели, подобные GPT-5 или GPT-6, могут исчерпать доступные источники данных к 2026 году.



Возникает вопрос: сможет ли искусственный интеллект продолжать развиваться без поступления новых текстовых данных от людей?

Последние достижения в области языкового моделирования в основном базируются на огромных объемах текста, написанного людьми из сети.

Компании, занимающиеся ИИ, уже сталкиваются с проблемой нехватки данных.



Для того чтобы преодолеть это препятствие, некоторые исследователи изучают возможность обучения языковых моделей на искусственно сгенерированных данных.



@sip_ai | @sip_ai_bot