Что мы узнали на этой неделе? 13D Research. 2 часть
Перевод 2 части документа от 13D Research.
Больше переводов в моём телеграмм-канале:
https://t.me/holyfinance
Содержание 2 части:
- Станет ли Китай тихой гаванью на фоне цунами глобальной инфляции? Принял ли Пекин политику сильного юаня, чтобы запустить “благоприятный цикл” в активах в юанях?
- Технология искусственного интеллекта, использующая логику, должна превзойти рыночный спрос на системы больших языковых моделей. Появятся новые огромные победители.
- Станет ли Tesla “акцией искусственного интеллекта”?
В оригинале исследования останутся две темы, разбирать которые не вижу смысла в рамках канала:
- Южноамериканский муссон ослабевает, приближаясь к переломному моменту по мере сокращения площади тропических лесов Амазонки. Ожидайте регионального воздействия на производство продовольствия и гидроэлектроэнергии, а также глобального воздействия на водные ресурсы и климат.
- Вы можете познакомиться с Сибуми в ущелье Тамина в Бад-Рагаце.
(Как мы уже писали, Сибуми - это японское выражение, которое невозможно перевести на английский. Мужчина или женщина Сибуми - это, по сути, личность всепоглощающего спокойствия.)
5. Станет ли Китай тихой гаванью на фоне цунами глобальной инфляции? Принял ли Пекин политику сильного юаня, чтобы запустить “благоприятный цикл” в активах в юанях?
С появлением новых рисков в сфере предложения сырьевых товаров становится все более вероятным сохранение высокой инфляции. Джереми Грэнтэм, соучредитель и главный инвестиционный стратег GMO, сформулировал это лаконично: “В конце концов, жизнь проста. Низкие ставки подталкивают цены на активы вверх. Более высокие ставки снижают цены на активы. Сейчас мы вступаем в эпоху, когда ставки будут выше, чем были за последние 10 лет”.
Пол Тюдор Джонс, основатель и директор по инвестициям Tudor Investment, недавно прокомментировал: “Поскольку процентные расходы в Соединенных Штатах растут, вы попадаете в этот порочный круг, где более высокие процентные ставки приводят к более высоким затратам на финансирование, приводят к увеличению выпуска долговых обязательств, что приводит к дальнейшей ликвидации облигаций, что приводит к более высоким ставкам, которые ставят нас в невыгодное финансовое положение”.
Во всем мире, на рынке государственных облигаций, это уже реальность, а не спекуляция. По данным Gavekal, с начала пандемии COVID государственные облигации Китая превзошли долгосрочные казначейские облигации США на 35,3%.
В то время как цены на государственные облигации развитых стран резко упали, государственные облигации Китая держались относительно хорошо, по крайней мере, на данный момент. Если инфляция в Китае систематически ниже, чем на Западе, при прочих равных условиях, то цены на активы в Китае должны быть систематически выше, чем на Западе, используя приведенные выше рассуждения Грэнтэма.
Это подводит нас к китайскому фондовому рынку, еще одной важной части активов, деноминированных в юанях. Хотя разрыв в доходности между США и Китаем (как показано на графике выше) по-прежнему благоприятствует американским активам - доходность 10-летних казначейских облигаций США на 186 б.п. выше, чем доходность 10-летних государственных облигаций Китая, - это может измениться, если валютный курс юаня вырастет достаточно быстро, чтобы компенсировать потери доходности.
Во второй главе (“Рефлексивность на валютном рынке”) своей книги “Алхимия финансов” Джордж Сорос объяснил, как работает “Благоприятный круг (“Benign Circle”)” Рейгана (в отличие от "Порочного круга" Картера), используя в качестве примера немецкую марку конца 1970-х годов. Мы приводим выдержку из Сороса следующим образом:
В случае Германии в конце 1970-х годов немецкая марка была сильной. Спекулятивные покупки сыграли важную роль в укреплении и поддержании благоприятного круга. Германия начала с положительного сальдо торгового баланса, и укрепление национальной валюты помогло удержать уровень цен на низком уровне. Поскольку экспорт содержал значительную долю импорта, реальный обменный курс, в отличие от номинального, оставался более или менее стабильным, и влияние на торговый баланс было незначительным. Поскольку преобладал спекулятивный приток, благоприятный круг самоподкреплялся: тот факт, что темпы укрепления валюты превышали разницу в процентных ставках, делал хранение немецких марок очень выгодным, так что спекулятивный приток был как самоподкрепляющимся, так и самоутверждающимся…
Может ли подобное произойти с сегодняшним китайским юанем и активами в юанях? Только время покажет. Следующий анализ призван помочь нашим читателям лучше понять ситуацию:
Обменный курс китайского юаня закрылся на отметке $0,13710 во вторник, увеличившись на 0,68% по сравнению с минимумом начала сентября в $0,13617. Это подразумевает ежемесячный прирост в размере 0,68% и годовой прирост в размере 8,2%, что более чем в четыре раза превышает текущий разрыв в доходности в 1,86% между США и Китаем.
Конечно, такие расчеты нельзя экстраполировать слишком далеко. Мы только хотим продемонстрировать, как работает этот механизм. Но это показывает, как покупка и удержание юаня может превзойти удержание доллара в то время, когда доходность в США выше.
Что касается валют, отличных от доллара, то китайский юань дорожает еще более быстрыми темпами. По данным Reuters, индекс корзины CFETS в юанях — показатель, отслеживающий силу юаня по отношению к корзине валют — достиг пятимесячного максимума в 99,67 в понедельник.
Также появляются признаки того, что китайские фондовые индексы достигают дна на относительной основе, как показано на следующем графике соотношения индекса Shanghai Composite к индексу S&P 500, за которым мы внимательно следили в последние кварталы. А индекс Hang Seng (индекс HSI, 17,893 гонконгских доллара) демонстрирует рост шесть дней подряд, начиная с 5 октября.
Способность Пекина сдерживать свою вековую инфляцию лучше, чем у других правительств, обусловлена многими факторами. Ниже мы перечислим некоторые из них.
В настоящее время в Китае находится крупнейший в мире центр обрабатывающей промышленности, на долю которого приходится почти треть от общего объема производства в мире. Огромные размеры этого производственного гиганта, а также все более изощренная экосистема и вспомогательная инфраструктура представляют собой широкий ров, который нелегко воспроизвести конкурентам.
Китай также имеет значительное преимущество в стоимости энергии, включая как ископаемое топливо (в основном уголь), так и возобновляемые источники энергии. Таким образом, в отличие от своих конкурентов-экспортеров, таких как Германия, Япония и Южная Корея, положительное сальдо торгового баланса которых резко сократилось или даже превратилось в торговый дефицит после начала войны на Украине, положительное сальдо торгового баланса Китая осталось огромным.
Большое и стабильное положительное сальдо торгового баланса Китая подтверждает конкурентоспособность его экспорта, подразумевая, что повышение курса юаня вряд ли окажет серьезное влияние на его торговый баланс. Это может спровоцировать важный поворот в международных потоках капитала, если все больше инвесторов начнут осознавать, что в Китае начинается потенциальный благоприятный цикл.
Более того, вопреки общепринятому мнению о том, что Китай очень скоро упадет в демографическую яму, предложение рабочей силы в Поднебесной останется избыточным, по крайней мере, в течение следующей половины десятилетия, о чем свидетельствует рекордно высокий уровень безработицы среди молодежи.
2. Технология искусственного интеллекта, использующая логику, должна превзойти рыночный спрос на системы больших языковых моделей. Появятся новые огромные победители.
Мы отслеживали последствия искусственного интеллекта на протяжении более десяти лет. Мы также утверждали, что “пограничные вычисления” и 5G коренным образом перестроят глобальный облачный сектор. Низкая задержка на “границе” сетей необходима для вывода данных с помощью искусственного интеллекта в критически важных по времени приложениях, таких как автономные автомобили, обнаружение мошенничества и персонализированная медицина.
Большие модели генеративного искусственного интеллекта (GAI), такие как OpenAI ChatGPT, требуют обучения с непостижимыми объемами данных и используют аппаратное обеспечение. В свою очередь, алгоритмы могут понимать, как люди пишут и говорят при создании нового контента.
Формируется новая трансформирующая отрасль, основанная на “моделях искусственного интеллекта”, подчеркивается в недавнем анализе The Economist. Три основные силы будут определять конечную структуру отрасли: (1) вычислительные затраты; (2) борьба за данные для обучения все более крупных и мощных LLM (больших языковых моделей); и (3) финансирование. Аппаратный бум GAI в первую очередь фокусируется на обучении моделей для повышения распознавания образов и точности вывода. Эта тенденция привела к резкому росту доходов фирм, предлагающих оборудование для обучения LLM.
Высокая стоимость вычислительных мощностей приводит к распространению гораздо меньших по размеру и более специализированных LLM для специализированных приложений. Появление моделей графического интерфейса с открытым исходным кодом также упрощает использование GAI. По оценкам Hugging Face, компании GAI с открытым исходным кодом, уже существует 1500 небольших, тонко настроенных моделей.
Широкая доступность и интеграция GAI в рабочие процессы создают спрос на недорогостоящие методы логического вывода. Логический вывод GAI - это процесс задания моделям LLM вопросов для генерации ранее невидимых данных или контента на основе изученных ими шаблонов. Логический вывод становится все более сложным по мере быстрого роста параметров модели, что увеличивает спрос на аппаратное обеспечение искусственного интеллекта.
Тенденция смещает спрос с оборудования, ориентированного на обучение, в сторону систем, ориентированных на логический вывод, что становится новым и более значимым рынком для поставщиков решений. Компании, которые снижают затраты на логические выводы за счет разработки целенаправленных энергоэффективных и “передовых” решений, имеют все шансы превзойти остальных.
- Устойчивые и быстрые темпы роста GAI требуют улучшения возможностей для логического вывода. По оценкам Bloomberg Intelligence, общий объем рынка GAI, как ожидается, вырастет в 40 раз в течение следующих 10 лет - с 40 миллиардов долларов до 1,3 триллиона долларов. При нынешних темпах внедрения американские модели GAI будут получать от 80 до 130 миллионов заданий в час к этому времени в следующем году, отмечается в исследовании Altman Solon.
Спрос на текстовые генерирующие промпты ИИ увеличится с 10 триллионов в настоящее время до более чем одного квадриллиона к 2028 году, при этом ежемесячно активные пользователи превысят 400 миллионов в этом году и превысят шесть миллиардов через пять лет, подчеркивает Tirias Research. Ожидается, что к 2028 году ежегодный спрос на создание изображений вырастет более чем в 400 раз и превысит 10 триллионов фотографий. - Логический вывод на LLM структурно отличается от предыдущих вычислительных бумов и требует значительных затрат энергии, что приводит к более высоким затратам и экологическим последствиям. Большая база пользователей LLM и сложность этих моделей значительно увеличивают текущие вычислительные потребности. LLM выполняют миллиарды вычислений каждый раз, когда возвращают ответ на запрос пользователя, которые становятся все более длинными и сложными. В то время как логический вывод искусственного интеллекта изначально потребляет меньше энергии, чем обучение, его обширные вычисления для миллионов пользователей в конечном счете потребляют больше энергии, чем обучение. По данным Facebook AI, выполнение логического вывода в LLM для языкового перевода может потребовать в 2-3 раза больше энергии, чем при первоначальном обучении.
- Крайне важно снизить затраты на логический вывод. Стоимость логического вывода станет самым важным определяющим фактором в более широком внедрении GAI в производственные процессы. По оценкам UBS, в январе 2023 года, 100 миллионов уникальных активных пользователей chat GPT в месяц обошлись OpenAI в 40 миллионов долларов только за обработку выводов. По оценкам NVIDIA, 80-90% энергетических затрат нейронных сетей приходится на текущую обработку логических выводов после того, как модель была обучена и выпущена для использования.
Уже появляются новые аппаратные и программные решения:
- Суперкомпьютерный центр в лаборатории Линкольна Массачусетского технологического института создал оптимизатор, который сопоставляет модели искусственного интеллекта с наиболее экономичным набором аппаратных средств для вывода. Их подход позволяет сократить потребление энергии при выводе на 10-20% при сохранении быстрого времени отклика за счет оптимального распределения рабочих нагрузок между графическими процессорами.
- Deci, стартап, занимающийся глубоким обучением, выпустил "Infery LLM", набор для разработки программного обеспечения для логического вывода (SDK), предназначенный для повышения производительности LLM при сохранении точности. Непрерывная пакетная обработка, расширенное выборочное квантование и сверхэффективный поиск входят в число функций платформы, которые приводят к снижению затрат на искусственный интеллект на 80%.
- Специализированные ускорители логического вывода с использованием искусственного интеллекта, расположенные на “границе” сетей, являются ключом к сокращению задержки отклика и улучшению общих возможностей логического вывода. Ускорители искусственного интеллекта - это высокопроизводительные машины с параллельными вычислениями, специально разработанные для эффективной обработки рабочих нагрузок искусственного интеллекта.
Ускорители логического вывода оптимизированы для обработки небольших пакетов новых данных в режиме реального времени, обычно генерируемых на периферийном устройстве, по сравнению с обширной статической обработкой данных в централизованных центрах обработки данных. Например, для технологии автономного вождения процессор должен быть способен обрабатывать поток данных изображения и выдавать практические результаты без снижения пропускной способности. Это знаменует собой ключевой шаг по сравнению со специализированными ускорителями, используемыми в центрах обработки данных. Ускорители логического вывода будут все больше оптимизироваться на основе требований к производительности, задержке и эффективности, специфичных для выводов данной модели, или рискуют устареть.
- Специально разработанные аппаратные и программные средства, ориентированные на логический вывод, готовы к быстрому росту. В центрах обработки данных приоритетное внимание уделяется оборудованию, оптимизированному для обучения модели, поскольку это, как правило, самый интенсивный с точки зрения вычислений и самый длительный процесс в технологическом процессе искусственного интеллекта. Напротив, для логического вывода требуется чрезвычайно низкая задержка, часто всего лишь миллисекунды или меньше.
- Новое предложение MosaicML для логического вывода позволяет заказчикам развертывать модели искусственного интеллекта по цене в 4 раза ниже, чем OpenAI LLM для текстовых задач и в 15 раз дешевле, чем OpenAI DALL-E 2 для генерации изображений. Компания предоставляет разработанные куратором модели LLM с открытым исходным кодом, которые экономически эффективно настраиваются и позволяют пользователям точно настраивать и развертывать их в частном порядке, уделяя особое внимание конфиденциальности данных и праву собственности.
- Google продемонстрировала, что ее облачные системы искусственного интеллекта превосходят предыдущие решения в 4 раза по производительности и экономической эффективности. Google Cloud предлагает три ускорителя искусственного интеллекта на базе NVIDIA. Его виртуальная машина A3, использующая графический процессор NVIDIA H100, превосходит предыдущую версию в 3,9 раза. Новейшая виртуальная машина Google G2, работающая на графическом процессоре NVIDIA L4, превосходит другие облачные решения по производительности и экономичности в 1,8 раза.
Компании, предлагающие передовые продукты, облегчающие вывод данных с низкой задержкой, особенно на “границе” сетей, имеют все шансы превзойти конкурентов. Мы остаемся долгосрочными покупателями индекса автоматизации 13D, который включает компании, способные извлечь выгоду, поскольку фокус сектора искусственного интеллекта начинает смещаться с производства оборудования для центров обработки данных на улучшение возможностей логического вывода.
Индексный компонент NVIDIA доминирует на рынке специализированных чипов искусственного интеллекта для обучения моделей и уделяет приоритетное внимание логическому выводу, предлагая полный комплекс ведущих продуктов для логического вывода. NVIDIA анонсировала TensorRT-LLM, программное обеспечение с открытым исходным кодом, которое удваивает производительность вычислительного графического процессора H100. Такое повышение производительности достигается без необходимости переобучения модели и обеспечивается такими функциями, как пакетная обработка в полете, которая оптимизирует планирование рабочей нагрузки, обеспечивая эффективное использование ресурсов графического процессора и ускоряя процессы вывода данных с помощью искусственного интеллекта.
Однако рынок логического вывода гораздо более открыт по сравнению со специализированными обучающими чипами, где NVIDIA явно лидирует.
Другие привлекательные компании:
- Advanced Micro Devices (AMD, $108,31) – ведущий производитель графических процессоров и процессорных микросхем, предлагающий ряд полупроводников и инструментов, оптимизированных для вывода данных с помощью искусственного интеллекта. К ним относятся серверные процессоры EPYC и графические ускорители Instinct. AMD ожидает, что их адресуемый рынок ускорителей искусственного интеллекта вырастет до 150 миллиардов долларов в течение следующих трех-четырех лет, причем две трети возможностей будут связаны с использованием искусственного интеллекта.
- Marvell Technology Inc (MRVL, $ 55,14) – ведущий производитель чипов для сетевых приложений центров обработки данных, и у нее хорошие возможности для получения выгод от использования искусственного интеллекта. Marvell предлагает свой 5-нанометровый блок обработки данных OCTEON и OCTEON 10, первую в отрасли интегрированную платформу для машинного обучения. Marvell ожидает, что ее бизнес AIchip удвоится в 2024 финансовом году до 400 миллионов долларов по сравнению с 2023 годом, и снова удвоится в 2025 финансовом году до 800 миллионов долларов, достигнув 15% выручки.
- Arm Holdings plc (ARM, $54,68) – ведущий разработчик чипов в области беспроводной связи, искусственного интеллекта и технологий центров обработки данных. ARM предлагает несколько продуктов для специализированного логического вывода, включая линейку чипов Ethos Neural Processing Unit, которые обеспечивают гибкую интеграцию, ускорение работы нейронных сетей и эффективность производительности. Кроме того, ARM оснащен процессором машинного обучения для логического вывода, который позволяет интеллектуальным устройствам принимать независимые решения с локализованными данными на границе, и высокопроизводительным графическим процессором ARM Mali-G76, который облегчает сложный графический вывод на устройстве.
- Cloudflare (NET, $65,29) – это глобальная платформа распространения контента, которая позволяет организациям безопасно развертывать приложения в больших масштабах. Новый сервис искусственного интеллекта Workers AI от компании предоставляет бессерверные возможности для быстрой доставки моделей искусственного интеллекта по всему миру. Cloudflare также расширяет свои сервисы искусственного интеллекта за счет партнерских отношений, таких как Microsoft и Hugging Face, чтобы усилить вывод данных с помощью искусственного интеллекта и обеспечить плавное развертывание нескольких типов моделей на своей платформе.
3. Станет ли Tesla “акцией искусственного интеллекта”?
Мы ознакомились с новой биографией Илона Маска, написанной Уолтером Айзексоном. Одна вещь, которую мы узнали об Илоне из наших собственных наблюдений, этой книги и другой биографии 2015 года — любите его или ненавидите — никогда не ставьте против него. Его решимость преуспеть в реализации своих замыслов не имеет себе равных в современной истории.
На эту книгу уже было множество рецензий, но что привлекло наше внимание, так это следующая цитата из интервью Джиллиан Тетт в “Ланче с Уолтером Айзексоном” в недавнем выпуске FT. Мы цитируем следующее: “Еще более поразительно, что Айзексон недавно наблюдал, как Маск приступил к доселе скрытному стремлению создать компанию по ИИ, где он, по-видимому, надеется использовать обширные хранилища данных из Twitter и Tesla, чтобы обогнать другие компании по ИИ, такие как OpenAI. Это может иметь огромное коммерческое значение для сектора искусственного интеллекта”.
Вот видение Маска в отношении искусственного интеллекта:
В течение многих лет система автопилота Tesla опиралась на подход, основанный на правилах. Он получал визуальные данные с камер автомобиля и идентифицировал такие объекты, как разметка полосы движения, пешеходы, транспортные средства, сигналы светофора и все остальное, что попадало в поле зрения восьми камер. Затем программное обеспечение применило набор правил, таких как: Останавливайтесь, когда горит красный свет; двигайтесь, когда горит зеленый; Оставайтесь посередине полосы движения; Не пересекайте двойные желтые линии во встречном потоке транспорта; Проезжайте перекресток только тогда, когда нет машин, движущихся достаточно быстро, чтобы сбить вас; и так далее. Инженеры Tesla вручную написали и обновили сотни тысяч строк кода на C++, чтобы применить эти правила к сложным ситуациям.
Проект планировщика нейронных сетей, над которым работал Шрофф, добавит новый слой. “Вместо того, чтобы определять правильную траекторию движения автомобиля, основываясь только на правилах, - говорит Шрофф, - мы определяем правильную траекторию движения автомобиля, также полагаясь на нейронную сеть, которая учится на миллионах примеров того, что сделали люди”. Другими словами, это имитация человека. Столкнувшись с ситуацией, нейронная сеть выбирает путь, основанный на том, что люди делали в тысячах подобных ситуаций. Это похоже на то, как люди учатся говорить, водить машину, играть в шахматы, есть спагетти и делать почти все остальное; нам может быть дан набор правил, которым нужно следовать, но в основном мы приобретаем навыки, наблюдая за тем, как их выполняют другие люди. Это был подход к машинному обучению, предложенный Аланом Тьюрингом в его статье 1950 года “Вычислительная техника и интеллект”.
У Tesla был один из крупнейших в мире суперкомпьютеров для обучения нейронных сетей. Он был оснащен графическими процессорами (GPU) производства производителя чипов Nvidia. Целью Маска на 2023 год был переход к использованию Dojo, суперкомпьютера, который Tesla строила с нуля, для использования видеоданных для обучения системы искусственного интеллекта. Благодаря чипам и инфраструктуре, разработанным собственной командой искусственного интеллекта Tesla, он обладает вычислительной мощностью почти в восемь экзафлопс (1018 операций в секунду), что делает его самым мощным компьютером в мире для этой цели. Он будет использоваться как для программного обеспечения для самостоятельного вождения, так и для робота Optimus. “Интересно работать над ними вместе”, - говорит Маск. “Они оба пытаются ориентироваться в мире”.
К началу 2023 года проект neural network planner проанализировал 10 миллионов кадров видео, собранных с автомобилей клиентов Tesla. Означает ли это, что он будет просто так же хорош, как среднестатистический водитель-человек? “Нет, потому что мы используем данные от людей только в тех случаях, когда они хорошо справились с ситуацией”, - объясняет Шрофф. Специалисты оценили видеоролики и поставили им оценки. Маск посоветовал им поискать то, что “сделал бы пятизвездочный водитель Uber”, и это были видеоролики, использованные для обучения компьютера.
Маск регулярно прогуливался по зданию Tesla в Пало-Альто, где инженеры по автопилоту сидели в открытом рабочем пространстве, и он садился рядом с ними для импровизированных дискуссий. Однажды Шрофф показал ему, какого прогресса они добиваются. Маск был впечатлен, но у него возник вопрос: действительно ли был необходим весь этот новый подход? Может быть, это немного перебор? Одним из его принципов было то, что никогда не следует использовать крылатую ракету, чтобы убить муху; просто используйте мухобойку. Было ли использование нейронной сети для планирования траекторий неоправданно сложным способом справиться с несколькими очень маловероятными крайними случаями?
Шрофф показал Маску примеры, когда планировщик нейронной сети работал бы лучше, чем подход, основанный на правилах. В демо-версии дорога была завалена консервными банками от поездов, упавшими дорожными конусами и случайным мусором. Автомобиль, управляемый планировщиком нейронной сети, смог объезжать препятствия, пересекая линии движения и нарушая некоторые правила по мере необходимости. “Вот что происходит, когда мы переходим от основанных на правилах к сетевым путям”, - сказал ему Шрофф. “Автомобиль никогда не попадет в столкновение, если вы включите эту штуку, даже в неструктурированной среде”. Это был своего рода прыжок в будущее, который взволновал Маска. “Мы должны провести демонстрацию в стиле Джеймса Бонда, - сказал он, - где со всех сторон взрываются бомбы, а с неба падает НЛО, в то время как автомобиль проносится мимо, ни во что не врезаясь”.
Системы машинного обучения, как правило, нуждаются в цели или показателе, которыми они руководствуются при самостоятельном обучении. Маск, которому нравилось управлять, определяя, какие показатели должны быть первостепенными, дал им ориентир: количество миль, которые автомобили с полным автономным управлением Tesla могли проехать без вмешательства человека. “Я хочу, чтобы последние данные о количестве миль за каждое вмешательство были отправным слайдом на каждой из наших встреч”, - постановил он. “Если мы обучаем искусственный интеллект, что мы оптимизируем? Ответ заключается в увеличении расстояния между вмешательствами”. Он сказал им сделать это видеоигрой, где они могли бы видеть свой результат каждый день. “Видеоигры без подсчета очков скучны, поэтому будет интересно каждый день наблюдать, как увеличивается количество миль без участия человека”.
Члены команды установили на своем рабочем месте массивные восьмидесятипятидюймовые телевизионные мониторы, которые в режиме реального времени отображали, сколько миль в среднем проезжали автомобили FSD без каких-либо вмешательств. Всякий раз, когда они видели повторяющийся тип вмешательства — например, когда водители хватались за руль во время смены полосы движения или поворота на сложный перекресток, — они работали как с правилами, так и с планировщиком нейронной сети, чтобы внести исправления. Они ставили гонг рядом со своим столом, и всякий раз, когда они успешно решали проблему, требующую вмешательства, они должны были бить в гонг...
Шрофф и двое его товарищей по команде подробно объяснили, как программное обеспечение FSD, которое они использовали, было обучено на миллионах видеоклипов, собранных с камер на автомобилях клиентов. Результатом стал программный стек, который был намного проще традиционного и основывался на тысячах правил, закодированных людьми…
Во время обсуждения Маск обратил внимание на ключевой факт, обнаруженный командой: нейросеть работала плохо, пока ее не обучили по крайней мере на миллионе видеоклипов, и она начала работать действительно хорошо после полутора миллионов клипов. Это дало Tesla огромное преимущество перед другими автомобильными компаниями и компаниями, занимающимися искусственным интеллектом. У компании был парк из почти двух миллионов Tesla по всему миру, которые собирали миллиарды видеокадров в день. “У нас есть уникальные возможности для этого”, - сказал Эллусвами на встрече.
Способность собирать и анализировать огромные потоки данных в режиме реального времени будет иметь решающее значение для всех форм искусственного интеллекта, от самоуправляемых автомобилей до роботов Optimus и ботов, подобных ChatGPT. И теперь у Маска было два мощных источника данных в режиме реального времени: видео с самоуправляемых автомобилей и миллиарды постов в Twitter каждую неделю...
Топливом для искусственного интеллекта являются данные. Новые чат-боты обучались работе с огромными объемами информации, такими как миллиарды страниц в Интернете и другими документами. Google и Microsoft, с их поисковыми системами, облачными сервисами и доступом к электронной почте, располагали огромными массивами данных, которые помогали обучать эти системы.
Что Маск мог бы принести на эту вечеринку? Одним из активов была лента Twitter, которая включала более триллиона твитов, опубликованных за эти годы, и пятьсот миллионов добавлялись каждый день. Это был коллективный разум человечества, самый оперативный в мире набор данных о реальных человеческих разговорах, новостях, интересах, тенденциях, спорах и жаргоне. Кроме того, это была отличная тренировочная площадка для чат-бота, чтобы проверить, как реальные люди реагируют на его ответы. Ценность этого канала данных не была чем-то таким, что Маск учитывал при покупке Twitter. “На самом деле это было побочное преимущество, которое я осознал только после покупки”, - говорит он…
У Маска была еще одна сокровищница данных: 160 миллиардов кадров видео в день, которые Tesla получала и обрабатывала с камер своих автомобилей. Эти данные отличались от текстовых документов, которые использовались чат-ботами. Это были видеоданные о людях, ориентирующихся в реальных ситуациях. Это могло бы помочь создать искусственный интеллект для физических роботов, а не только для чат-ботов, генерирующих текст.
Его главной миссией всегда было обеспечить, чтобы искусственный интеллект развивался таким образом, чтобы гарантировать сохранение человеческого сознания. По его мнению, этого лучше всего достичь, создав форму искусственного общего интеллекта, который мог бы “рассуждать” и “мыслить” и стремиться к “истине” в качестве своего руководящего принципа. Вы должны уметь ставить перед ним большие задачи, такие как “Создать лучший ракетный двигатель”.
Маск надеялся, что когда-нибудь он сможет взяться за еще более грандиозные и экзистенциальные вопросы. Это был бы “максимально правдивый искусственный интеллект. Он заботился бы о понимании Вселенной, и это, вероятно, привело бы его к желанию сохранить человечество, потому что мы - интересная часть Вселенной”.