Михаил Плискин ("Ланит-Терком") об управлении компьютером с помощью жестов

Российская компания "Ланит-Терком" разработала решение, позволяющее без дополнительных приспособлений (типа перчаток-маркеров) управлять компьютером и различными устройствами с помощью жестов. Система, названная ViEye, распознает жесты с помощью двух бюджетных видеокамер – и выполняет соответствующие операции.

Читатели "Компьютерры" узнают о ViEye первыми: "ЛАНИТ-Терком" доверила нам анонсировать технологию. Подробности - в беседе "Компьютерры" с директором Центра компетенций "ЛАНИТ-Терком" Михаилом Плискиным.

- Что такое ViEye?

- Наша передовая разработка - "видеомышь". Что это? Берется компьютер, две камеры на мониторе - обычные, в магазине продаются за небольшие деньги. Дальше берутся две руки - и начинаем ими двигать картинку (показывает на тестовой машине. - прим. ред.): поворачивать, увеличивать, уменьшать... или уменьшить/увеличить насыщенность картинки. В сущности, мы распознаем движение пальцев камерами.

- Сразу возникает "неприличный" вопрос: как отреагирует главный патентный гуру, Apple?

- Они запатентовали "мультитач", этого у них нет... пока. Это пока "чисто". Там, конечно, есть люди, занимающиеся сходными вещами - не мы одни такие умные в этом мире. Люди "копают" с разных сторон. Например, в Microsoft экспериментируют с помощью стробоскопических камер, подсветки и прочих вещей. Есть люди, разрабатывающиерешения на основе инфракрасной камеры. У нас две обычные оптические камеры, и идея в том, что на стереоизображении мы пытаемся анализировать двойной поток, стереопоток и понимать в нем пространственные параметры картинки. Что важно, это делается без маркеров (ничего не надо надевать на руку) и обычными камерами.

- Насколько оно бюджетно, это решение?

- Понятно, что в нынешнем варианте это простейшее решение на РС (правда, довольно мощном), и для его работы требуется большое искусство, но тем не менее оно работает. А в планах - к сентябрю сделать коробочку небольшого размера, стоимостью вместе с камерами при разумных количествах выпуска долларов так в 200... даже 150, если получится. То есть будет две камеры плюс коробочка, которая втыкается в USB-порт - и больше практически ничего не потребуется.

- На какой рынок пойдете для начала?

- Это стратегический вопрос. Мы хотим продать технологию кому-то из больших игроков. Идти на рынок устройств для конечного пользователя мы без сильного партнера не сможем. Идеи самостоятельного освоения рынка периодически возникают и обсуждаются, но это вряд ли возможно. Для этого необходимы прочная ‘supply chain’ и мощные инвестиции в то, что мы на самом деле еще не умеем делать. Нам хочется партнерства с компаниями уровня Apple, Dell или Nokia.

- Тем не менее, каково наиболее очевидное применение технологии, на ваш взгляд?

- Вплоть до эндоскопии в медицине. Самое популярное, на мой взгляд - bacteria free environment, когда устройство помещается в общественном месте для бесконтактного использования.

- А чем в таком случае не угодили инфракрасные устройства?

- Инфракрасные устройства очень требовательны к условиям среды - температуре, влажности... здесь тоже есть ограничения (например, освещенность), но их гораздо меньше.

- То есть на данный момент возможности решения зависят от характеристик камеры...

- ... и от мощности "железа", то есть системного блока.

Набор движений пальцами для управления компьютером

- Решение кроссплатформенное?

- Сейчас ViEye работает под Linux - это основная девелоперская платформа, но через недельку-другую у нас будет "виндовая" версия, и уже сейчас есть версия на "железке" - на DSP-процессоре. Здесь важен вопрос целевой аудитории. Если бы мы делали решение для конечного пользователя, на PC, то уделили бы внимание адаптации системы под Windows. У нас нет такой задачи, к тому же сейчас вот эти две камеры "забивают" нам четырёхядерный процессор примерно на 95 процентов. Конечно, мы умные люди и мы ускорим решение - но не в сто раз, а, может быть, только в пятьдесят. Мы не можем позволить себе продавать решение, превращающее компьютер пользователя в калькулятор. Это все-таки "мышка", а не статистический пакет. Понятно, что для такого рода задач нужен специализированный софт и более-менее специализированное "железо". Мы и "железку" делаем не для того чтобы продать, а чтобы продемонстрировать, что наше решение не требует сверхъестественных мощностей.

- Какова здесь скорость обработки кадра?

- Сейчас мы делаем примерно 15 кадров в секунду. На самом деле, здесь устанавливаются границы, в которых можно обработать этот поток для конкретных целей. То есть "от сих до сих" в кадре - существенная информация, остальное некритично, и наполнение кадра не так существенно. А наши алгоритмы анализа видеопотока с двух камер одновременно позволяют определять глубину расположения объектов, а также динамически корректировать разрешение и распознавать мелкие детали. 

- Меня интересует, насколько это решение готово для выхода в массовое производство.

- Прямо сейчас это будет довольно дорого. Через три-четыре месяца, как я уже говорил, мы сделаем устройство, которое можно будет поместить в коробочку. А к декабрю есть неплохие шансы, что мы или кто-то другой сможет сделать микросхему, которую можно встраивать, например, в телефон.

- То есть вы все-таки собрались на рынок мобильных устройств.

- И на мобильный. Или на рынок встраиваемых систем. Или, например, если хорошо "отточить" технологию, можно встроить устройство в телевизор - и управлять им без пульта.

- Думаете, будет ажиотажный спрос?

- Не исключено, подобной возможностью уже интересуются шведы.

- В данной разработке вы пионеры?

- В данном подходе - да, решений с двумя камерами еще не было.

- Не думали патентовать решение в Америке, чтобы потом долго и мучительно не судиться?

- Естественно, у нас же алгоритм не патентуется, а у них патентуется все что хочешь. Как раз к 2015 году запатентуем (улыбается). Да, патент делается не для того чтобы защитить, а чтобы было чем отбиваться.

- Почему было принято решение о создании ViEye, вы ведь в основном занимаетесь аутсорсингом?

- Для нас ViEye - это попытка сделать продукт в широком понимании слова. Это не сервисная разработка.

- Наверное, вы как аутсорсинговая компания не от хорошей жизни перешли на собственные разработки?

- Здесь выше норма прибыли - если мы преуспеем, конечно. Но выше и риски.

- Понятно, но вы знаете сами: пока русского ИТ-предпринимателя не взбудоражишь - он не "полетит". Значит, можно судить о том, что у вас наступил определенный дисбаланс?

- Кафедра системного программирования матмеха СПбГУ, с которой мы сотрудничаем, давно занимается обработкой видео, и поколения просто набрали критическую массу. Но конечно, одно дело - продолжать академические исследования, а другое - бросить на это дело деньги и ресурсы, когда у нас есть сроки, планы, западные партнеры... Что такое аутсорсинг? Мы решаем чужие проблемы, но в то же время помогаем людям экономить. Чтобы заработать на этом много, нужно брать масштабом. Масштабом мы, конечно, зарабатываем, но хочется большего. Чтобы добиться большего, надо увеличить норму прибыли - и по идее, это правильный путь.

- То есть вы просто стараетесь поднять свой финансовый уровень, а не, скажем, занять долю рынка?

- Для нас важна диверсификация бизнеса - чтобы не отстать от рынка, надо быстро бежать. А чтобы успеть, надо бежать еще быстрее. Для нас это попытка диверсификации. Что будет, конечно, никто не знает, но шансы у нас неплохие.

Автор: Ирина Матюшонок

http://www.computerra.ru/interactive/543108/