Как инженер-программист потратил $1 000 000 и 8 лет, чтобы создать свой переводчик

Компания прошла путь от отчаяния (когда расчеты предрекали 28 лет на разработку) до триумфальных сделок с гигантами вроде Opera и Vivaldi. Стартап ушел с рынка мобильных приложений с 40 миллионами скачиваний, но нашел новый, еще более перспективный. Вместо Google-переводчика в облаке — офлайн-решение для заводов, больниц и браузеров. Вместо платной подписки — принцип «платите, только если довольны». Алексей Рудак, основатель Lingvanex, рассказал «Про бизнес», как выйти на корпоративный рынок без портфолио, почему бесплатная модель продаж может быть эффективной и как одна видеокарта за $ 70 в месяц способна переводить миллиарды символов в сутки.
«По нашим расчетам, с такими ресурсами на создание качественного перевода для 50 языков потребуется 28 лет»
— В начале 2020 г. мы продолжали улучшать продукт, но я еще не был доволен результатом. Для создания качественного перевода нам нужно было все больше данных, а чтобы обработать большие объемы данных, требовались мощные компьютеры. Мы старались экономить и арендовали всего 20 недорогих компьютеров. И тут возникла одна проблема. По нашим расчетам с такими ресурсами на создание качественного перевода для 50 языков потребуется 28 лет. Это меня очень сильно расстроило, но я все равно продолжал искать решение.
В течение года мы участвовали в различных бизнес-конкурсах в надежде выиграть бесплатные гранты от спонсоров. И однажды нам улыбнулась удача. Через несколько месяцев мы выиграли AWS Startup Challenge и получили 100 000 бесплатных кредитов, которые можно было потратить на аренду мощных компьютеров. C 28 лет время разработки сократилось до 3 месяцев, за которые мы и перетренировали наши языковые модели и улучшили качество перевода. Также выиграли конкурс от Venture Day Minsk с оплатой поездки в Великобританию для поиска клиентов, но пришел Covid, и наша поездка отменилась.

Параллельно я смотрел, что делают конкуренты, и следил за рынком. Стали появляться проекты в области машинного перевода (переводы конференций в реальном времени, переводы видео, подкастов). Компании, которые долго специализировались на переводе только человеком, стали ивестировать в машинные переводы. Основой для такой переориентации послужил экономический эффект для бизнеса от локализации. Постоянное улучшение качества машинного перевода позволило во много раз сократить затраты и полностью перейти на автоматический перевод.
«Продвижение в магазинах приложений без затрат на рекламу, на котором удалось собрать 40 миллионов скачиваний и заработать первый $ 1 млн., перестало работать»
До 2021 г. наш фокус был на мобильных приложениях для перевода. Но этот рынок очень изменился. Продвижение в магазинах приложений без затрат на рекламу (ASO), на котором удалось собрать 40 миллионов скачиваний и заработать первый $ 1 млн., перестало работать: подбор ключевиков в App Store без закупки платных установок стал не эффективен, а привлечение пользователей через закупку трафика — очень дорогим.
Нам посоветовали попробовать рынок B2B. Расчет был на то, что любому международному бизнесу нужна функция перевода. Это может быть перевод документов, сайта, многоязыковая поддержка клиентов, анализ конкурентов и проч. Мы потратили неделю на изучение продаж корпоративному сегменту и вот что обнаружили: по статистике, каждый год более 1 миллиарда человек ищут в интернете решения, связанные с переводами. Каждый день увеличивается количество данных на разных языках, а доля английского языка в интернете сейчас сократилась до 25%. Мы решили, что перспективы есть. Согласно некоторым опросам, более 72% потребителей заявили, что они купят на сайте быстрее, если он представлен на их родном языке. Оказалось, что рынок большой и сформированный. Большинство компаний предлагали переводы онлайн без привязки по тематикам (медицина, юриспруденция, нефтехимия и т.д.). Это приводило к проблеме безопасности данных и качеству перевода. Например, если вы студент или турист и вам нужно перевести небольшую статью для личных целей, можно использовать бесплатные сервисы типа Google или Yandex. Но если вы компания, то переводить письма клиентов, накладные, справки и прочие внутренние документы через бесплатные онлайн-сервисы может быть небезопасно, так как такие компании собирают ваши данные, чтобы потом продать их рекламодателям. Кроме того, переводы больших объемов текста через Google API будут стоить очень дорого. Для таких случаев мы сделали возможность устанавливать переводчик в корпоративную сеть и переводить текст и файлы без доступа в интернет. Перевод происходит оперативно и с сохранением форматирования. Во всех решениях доступны все языки, что есть у Google, и даже больше.
Мы определили для себя следующие отличия от конкурентов:
- Наш переводчик может работать без доступа в интернет и работает на компьютерах пользователей. Это позволяет не беспокоиться, что данные могут быть переданы третьим лицам.
- Программа может работать на любой платформе (мобильной, ПК, сервер, Web) и переводить миллионы веб-страниц, файлов, аудио, текстов в день на 100 языков.
- Корректный и точный перевод по определенным тематикам (медицина, металлургия, нефтехимия, юриспруденция и т.д.) по API, в том числе c интеграцией в инструменты для профессиональных переводчиков.
В октябре 2021 г. мы собрали свой первый прототип переводчика для рынка B2B. Это было серверное решение под операционную систему Linux. Осталось только найти клиентов.
«Как убедить потенциального клиента, если нет портфолио?»
B B2B очень важна репутация и портфолио компаний, где уже успешно интегрированы такие решения. Но как убедить потенциального клиента, если нет портфолио? После публикации статьи, нам написал менеджер компании Vivaldi и спросил, можно ли протестировать продукт. Для них было важно, чтобы все, что переводят пользователи, не передавалась третьим лицам, так как они позиционировали себя как «защищенный браузер». Потом оказалось, что менеджер родился в Беларуси, а теперь живет в Норвегии, где находится штаб-квартира компании. Мы предложили интегрировать наш переводчик в их браузер бесплатно взамен на то (если интеграция будет успешной), чтобы добавить кейс в наше портфолио. Работа началась и длилась около года. Мы потратили достаточно времени на оптимизацию скорости перевода. Теперь 1 миллиард символов текста можно перевести за сутки на одной видеокарте Nvidia GTX 1080, аналог которой можно арендовать за $ 70 в месяц.

После браузера Vivaldi мы интегрировали сервер в медицинский онлайн-справочник. Клиент хотел сэкономить на диске и не хранить переведенные страницы в базе данных, поэтому переводы веб-страниц происходят динамически, в соответствии с поведением пользователя на сайте. Третьим проектом, где стал использоваться переводчик для бизнеса, был большой интернет-магазин в азиатском регионе. Им требовался автоматический перевод описаний товаров на 87 языков. Товары постоянно обновлялись, добавлялись новые, поэтому все требовалось делать оперативно. Чуть позже мы продали переводчик агентству по лидогенерации, компании, которая занимается аналитикой новостей, плагину для перевода веб-сайтов, заводу электроники. Наш продукт оказался востребован везде, где много контента и есть международная аудитория. Постепенно фокус сместился на решения для бизнеса вместо мобильных приложений, которые приносят только 20% выручки.
Со временем у нас стали интересоваться функцией транскрипции речи. В основном это были финансовые и страховые организации, поликлиники, колл-центры, которым нужно было конвертировать голос в текст и потом анализировать качество обслуживания. В программу было добавлено распознавание речи на 90 языков с поддержкой субтитров.
Когда мы совершили сделку с Vivaldi, то смогли легко выйти на сотрудничество с Opera. Основатель Opera Йон Стефенсон фон Течнер является и основателем Vivaldi. После партнерствв с Opera стало намного легче привлекать B2B-клиентов. Получение в портфолио игрока такого уровня открыло двери и в другие корпорации.
Мы решили внедрить принципиально новую модель работы с клиентами, которая заключается в том, что мы бесплатно даем продукт и улучшаем его до тех пор, пока клиент не будет полностью доволен его качеством. От клиентов нужно только выходить на связь и давать отзывы, при этом не требуется никаких предоплат. Я считаю, что это самая честная модель бизнеса, при которой сначала демонстрируется ценность продукта, и только после этого идет речь об оплате.
Основа любого успешного бизнеса — люди. Не идея, не рынок, не технология, а именно команда. Даже если она ошибется в начале, то все равно «вырулит» к цели. Своей же главной проблемой считаю то, что я стал «публичным» очень поздно. Следовало на старте создавать и продвигать контент о проекте, выступать на мероприятиях, давать интервью. Не нужно было отдавать часть задач по разработке на аутсорс и фрилансерам, а сразу собирать свою команду профессионалов. Сейчас понял, что для сильных сотрудников важен личный пример. Опытные люди хотят работать с такими же. На данный момент в нашей команде около 40 человек, и я доволен тем, что несмотря на все трудности, мы нашли эффективную бизнес-модель, которую сейчас и развиваем.