vadim kataev logo compuvisor vm agent ai

Jobs Jobs Jobs !

Looking for work in one of the most successful companies in the world? We have many open positions for Project Managers, Research Engineers, Scientists, Software Engineers, Test and QA Engineers and related. The area of the work is AI: Natural Language Understanding/Processing, Speech Recognition.

If someone interested, don't hesitate, and please contact me directly.
vadim kataev logo compuvisor vm agent ai

В предверии Ассистента в новом IPhone

Завтра Эппл представит свои новые продукты и одна из возможных интересных тем - это презентация новой фичи под названием Ассистент. Ассистент - это диалоговая система. Пользователь общается с ассистентом используя обычную речь. Ассистент выполняет команды пользователя, помогает ему вести учёт дел, и общается с пользователем обычным языком, обычной речью. Выглядит это как разговор пользователя с реальным ассистентом - человеком. В этом блоге я часто писал о диалоговых системах, выкладывая и ролики с диалогами (например см. по тагу technology).

С появлением Ассистента в новом смартфоне от Эппла, распознование речи получит второе дыхание и интерес со стороны разработчиков мобильных систем. Конечно, и сейчас есть различные диалоговые приложения, но интеграция такой фичи в саму систему - это несколько иное, это более прогрессивный шаг. До завтрашней презентации пока сложно предсказать, будет ли Ассистент сразу поддерживать основные мировые языки, кроме английского.

Диалоги на натуральном языке в самое ближайшее время станут обычным делом. Кстати, в каких ещё фильмах обыгрывались сценарии общения человека с компьютером с помощью речи? Я припоминаю комьютер HAL9000 в "Одиссее 2001", бортовой компьютер корабля в "Sunshine" (1997), и вроде как в "I Robot" было что-то если я ничего не путаю.

PS: это пока только слухи, поэтому подождём немного :)
vadim kataev logo compuvisor vm agent ai

Андроид 2011

Почемуто Андроид мне не нравится. Даже не знаю, что именно, но пользоваться такой системой как то не удобно. Я обоими руками за Линукс, открытость. Может быть просто не привычно - эпл был первым и привязал к своему мобильному интерфейсу уже многих пользователей. У эпла хотябы какой то минимализм и продуманность каждой фичи присутсвует - у андроидов какой то безсистемный хаос, кнопки лишние, лишние украшения на фоне плохого решения других проблем.

Возможно Гугл совершил ошибку, выбрав яву в качестве основного языка для разработки приложений. А может быть, если рассуждать в терминах прибылей, всё не так и плохо. Андроид активно развивается, а фундамент у него в лице Линукс кернела и обрезаной libc, довольно прочный.
vadim kataev logo compuvisor vm agent ai

Dropbox vs iCloud

Looks like Apple has reinvented Dropbox? But there is a huge advantage Dropbox has - its platform independence. Dropbox just works everywhere - whether it's Android or Ubuntu. I doubt Apple will port their iCloud clients so widely. But in common, this is right direction, even if many of us will prefer personal clouds in form of private Network Attached Storages.
vadim kataev logo compuvisor vm agent ai

Нокия 2011

Нокия не унывает. Неплохие результаты плюс хорошие дивиденды - имхо компания недооценена. Наряду с биткоинами - неплохая возможность для инвестирования. Хотя относительно биткоинов - тут я как понимаю пока большинство инвесторов с трудом понимает - что это такое.
vadim kataev logo compuvisor vm agent ai

Недостатки в Kinect

Самый большой недостаток - невозмошность качественного совмещения видео-картинки с картой глубины. Сама карта глубины довольно качественная - битовая разница заметна для изменений в сантиметр-величину , удалённык на расстояния в диапазоне 50-150 см. Из-за того, что инфра-красный сенсор накодится на некотором расстоянии от видео сенсора, полного совмещения видео-картинки с картиной глубины добиться не удаётся. Структурный свет имеет ряд недостатков, например чёрный пластик имеет тенденцию быть вообще незамеченным, некоторые материалы так-ше рассеивают проецируемую картинку странным способом.

В целом однако, все ети недостатки минимальны в сравнении с тем, какие возмошности для человек-машинного интерфейса появляются благодаря качественной карте глубины. Возмошно, совсем скоро структурный свет завоюет и рынок мобильнык устройств, т.к. с его помощью мошно производить простое распознование 3д обьектов.

Я сделал небольшую демку, показывающую как совмещается видео с картой глубины, при етом распознаются и маркируются рты людей, даше потестировал её на одной из презентаций :)