О Deepseek и будущем ИИ
Потирая ручки, наблюдаю за движухой, что вызвал Deepseek. Это, если что, новый аналог ChatGPT, который выкатил китайский стартап. Казалось бы, что такого? Ну сделали и сделали, одним больше, одним меньше. Однако, разница существенная. Китайцы утверждали, что разработали свою модель за скромные 6,7 миллионов долларов – а это копейки, по сравнению с охулеардами, требовавшимися для разработки OpenAI. А функционал у бесплатной версии сопоставим с платной моделью GPT o1, за который OpenAI требуют 200 баксов в месяц.
Второй момент – Deepseek – это опенсорс, в отличие, от, иронично названного, «Открытого ИИ». А это очень круто. Это значит, что коммерциализация OpenAI и ему подобных, основанная на интеллектуальной собственности, резко падает, а мировая конкуренция увеличивается.
Третий момент – это ресурсоемкость. Deepseek – не только дешевый, он еще и не жрет столько энергии, процессивной мощности, и сверхпроизводимых видеокарт NVIDIA. А это очень круто, потому как выводит ИИ из корпоративных хайтек гигантов в более бюджетную среду. До этого мощности были бутылочным горлышком, тормозящей развитие ИИ.
Каким макаром Глубокопоиск добился этих результатов? Новые подходы, в частности, MoE – mixture of experts, смесь экспертов. Это значит, что для решения, нейросетка напрягается не вся, а перенаправляет решение в более локальную подсеть, что существенно снижает нагрузку на систему. Примерно тоже самое делают «мокрые» мозги. Еще такая штука как «reinforcement learning» - обучение с подкреплением. Опять же, так это делается в природе. Она позволяет крупной нейросети обучить маленькую в процессе, красиво названным дистилляцией. Это, в свою очередь, открывает дорогу любителям, которые способны создать клевенькие сфокусированные нейросетки, которые можно гонять на домашнем железе.
Ну и еще одна вишенка на торте китайского успеха. Как там в меме – the secret ingredient is crime. Китайцы, само собой, нап..здили датасеты OpenAI (я вам это не говорил). Вообще не жалко, учитывая, что открытоИИ-шники, в свою очередь, стащили данные со всего интернета, хуя на вертю авторские права с правообладателями. Дипсик, таким образом, выступает в роли Робин Гуда, возвращает знания обратно в народ, что автор лично, горячо приветствует. Еще, как нетрудно догадаться, ChatGPT обучал Deepseek в процессе, уже упомянутых, реинфорсмент лернинг и дистилляции (Сэм Альтман засек это и прикрыл калитку, но слишком поздно). Да, будет ли Китай коммуниздить личную информацию пользователей? Будет (спасибо, кэп). Добро пожаловать в клуб к другим ИИ-моделям и чату жпт в частности.
Кароче, весь мир резко понял, что ИИ может быть дешевле, быстрее и открытей. А это в свою очередь вызвало обвал фондового рынка американских IT-компаний, чья стратегия, базировалась на том, что ИИ должен быть дорогим и непрозрачным. Гыгы, но, к слову, некоторые китайские корпорации тоже малец охренели. КНР швырнул америкосам нехилую такую бомбу в айти-бункер, посмотрим, как будут оправляться.
Теперь начинаются настоящие голодные игры: к гонке ИИ подключаются условные нищеброды (стартапы и университеты), которые часто бывают весьма талантливыми. А это уже резкий скачок в прогрессе, AGI (сильный искусственный интеллект) не то что не за горами, он - за кочками. Немного напрягает мысль, чего может добиться тот же OpenAI, если совместит горы золота и видеокарт, на которых сидит, с китайскими ноухау. Революция искусственного интеллекта продолжается. Будет интересно.