
Поруч із Папою Левом XIV, коли він виголошував свою першу енцикліку про небезпеки штучного інтелекту, сидів несподіваний гість: самопроголошений атеїст і мільярдер-співзасновник однієї з найдорожчих AI-компаній у світі.
Кріс Олах, співзасновник Anthropic і відомий дослідник безпеки ШІ, який очолює в компанії напрям interpretability (інтерпретованості), сам відзначив незвичність своєї появи під час презентації у Ватикані минулого тижня.
«Я хочу почати з того, що може прозвучати дивно з уст співзасновника AI-компанії», — said він у підготовленому виступі. Пояснюючи, як залишатися прибутковими й водночас лідирувати в дослідженнях, не потрапляючи під тиск геополітики, Олах наголосив: компанії, що розвивають ШІ, мають переконуватися, що вони «роблять правильні речі», просуваючи інновації вперед.
«Якими б щирими не були наші наміри діяти правильно, і я вірю, що в багатьох вони такі, на нас усе одно впливатимуть ці стимули», — сказав він у своїх заготовлених тезах.
Через цей парадокс — будувати frontier AI-бізнес і водночас триматися a value-driven mission — Олах, сидячи поруч із Папою Левом XIV, попередив: зовнішні критики, зокрема Католицька церква, а також науковці й держави, повинні наглядати за галуззю та тримати її моральні зобов’язання в центрі уваги.
«Дехто може вважати, що питання ШІ найкраще залишити комп’ютерним науковцям на кшталт мене», — додав він під час виступу. «Вони помиляються».
Кріс Олах: походження, кар’єра та роль у безпеці ШІ
Його поява у Ватикані виглядала так само несподівано, як і шлях, що привів його туди.
Олах виріс у Торонто (Канада) і був «ревним євангельським християнином», доки he became an atheist at the age of 15. Він вступив до Університету Торонто вивчати математику, але залишив навчання приблизно через рік.
Ще за рік, у 2012-му, він отримав $100 000 від Thiel Fellowship — програми, створеної співзасновником PayPal Пітером Тілем, щоб допомогти талановитій молоді розвивати інші інтереси замість традиційного чотирирічного диплома. У video про переможців стипендії Олах казав, що йому подобається «робити математичні візуалізації з 3D-принтерами».
Якщо подивитися на його професійний шлях, видно, що любов до математики та технологій нікуди не зникла. Починаючи з 2015 року він три роки працював у Google Brain, який у 2023-му став частиною Google DeepMind. Він стартував як стажер і з часом доріс до посади research scientist. Паралельно Олах допомагав створювати інструменти для візуалізації процесів усередині нейромереж у новому тоді напрямі, який називають «механістичною інтерпретованістю»; на той момент він був не надто популярним, бо більшість дослідників насамперед зосереджувалися на trying to make AI more powerful.
Утім, ще в Google Олах долучився до робіт, які привернули нову увагу до того, як саме працюють нейронні мережі. Зокрема, він був серед авторів дослідження The Building Blocks of Interpretability, що дало одне з перших «вікон» у те, як нейромережі вибудовують складні поняття зі простіших структурних блоків.
«Спочатку це була доволі невелика група людей, яких ці питання цікавили», — розповідав Олах у подкасті 80,000 Hours. Згодом його робота привернула увагу компанії OpenAI, творця ChatGPT, де він перетворив інтерес до логіки нейромереж на повноцінну професію.
У період з 2018 до 2020 року Олах очолював команду OpenAI з інтерпретованості. Там він працював над двома знаковими дослідницькими ініціативами. Перша, відома як проєкт Circuits, націлювалася довести, що нейромережі містять ідентифіковану, людинозрозумілу інформацію, сформовану структурованими патернами нейронів, які можна інтерпретувати.
Друга — відкриття мультимодальних нейронів у CLIP, моделі OpenAI, що поєднує текст і зображення. Команда Олаха з’ясувала, що окремі нейрони всередині моделі would “fire” у відповідь на той самий концепт, наприклад «Spider-Man», незалежно від того, чи це фото, малюнок або текст. Це дослідження підсилило аргумент, що штучні нейромережі можуть працювати певною мірою схоже на людський мозок.
У 2020 році Олах був серед семи перших співробітників OpenAI, включно з CEO Даріо Амодеї, які залишили компанію через занепокоєння щодо безпеки ШІ. Пізніше він допоміг заснувати Anthropic разом із цією групою; після нещодавнього раунду фінансування компанію оцінили у $965 млрд. Цього тижня компанія confidentially filed документи для IPO. За даними Bloomberg Billionaires Index, нині статки Олаха становлять трохи менше ніж $8 млрд.
Позиція Олаха, озвучена поруч із Папою, різко контрастує з думками інших діячів індустрії, зокрема Марка Андріссена, який у своєму маніфесті 2023 року Techno-Optimist Manifesto стверджував, що «trust and safety» та «tech ethics» є частиною кампанії деморалізації, яку ведуть «вороги» проти технологій і життя.
Водночас слова Олаха загалом узгоджуються з місією Anthropic, яка ставить акцент на безпеці і не уникає публікації досліджень on the risks of AI. Це також перегукується з енциклікою Папи, Magnifica Humanitas, що пропонує моральну рамку для ШІ та закликає до «виваженого й пильного підходу» в його розвитку, а також до пріоритету людини над машиною.
В Anthropic Олах продовжив розвивати напрям механістичної інтерпретованості, намагаючись «розібрати» AI-моделі навпаки: визначати, які кластери штучних нейронів активуються для яких функцій і як саме вони формують відповіді моделі.
У 2024 році Time включив його до списку TIME100 AI — переліку найвпливовіших людей у сфері ШІ.
«Якби ми справді могли зрозуміти ці системи — а для цього потрібен значний прогрес — ми змогли б приходити й казати, коли ці моделі насправді безпечні, — пояснював він Time. — Або ж вони лише здаються безпечними».
This story was originally featured on Fortune.com



