Разработчики продуктов обработки естественных языков (для русского языка).

Инф для бизнеса — подразделение «Ашманов и партнеры» . Чат бот (похож на «Скрепку» из старого MS Офиса).

EORA (ООО «ЗенСолюшнс») — небольшая (11 человек) компания из сколково, существует с 14 года, «в 2016 было открыто дополнительное направление ZenSolutions, которое специализировалось на разработке чат-ботов с акцентом на понимание естественной речи (NLP/NLU)». Описания продуктов на сайте не представлены (выводятся HTTP 404 ). Тезисно (без конкретики) перечислены решения для: банков и страховых, ретейла, городов, Call-центров, логистики. На Medium заявленно три статьи о участии в «хакатонах» от сколково, сбертеха. О использовании технологий обработки естественного языка заявленно только в одном (smart уличный фонарь) с обещанием выхода на зарубежные рынки (дата не указанна).

Jast AI — специализируются на создании чат-ботов (на habr-е популяризируют тему). Заявляют «разговорных ассистентов», конструктор ( чат-ботом с AI ), роботы ( конкретная разработка робот Емеля (10000 руб.) — дистрибьютор другая фирма), работают с «Алисой». Разработчики связанны с i-Free (финансовые услуги- Кошелек , мобильный контент и др)

Материалы по обработке текстов на естественных языках

  1. Snips NLU is a Natural Language Understanding python library that allows to parse sentences written in natural language, and extract structured information.
  2. wit.ai Easily create text or voice based bots that humans can chat with on their preferred messaging platform. Разработка Facebook, поддерживает русский язык.
  3. dialogflow.com Build natural and rich conversational experiences. Разработка Google, поддерживает русский язык.
  4. luis.ai See Language Understanding in action

Русский

  1. Парсим русский язык
  2. Заметки об NLP (часть 10)
  3. NLP: проверка правописания — взгляд изнутри (часть 4)
  4. Сравнение Luis.ai, Api.ai и Wit.ai

Техническое задание на инструмент морфологической обработки текста

Если вычислительные системы научатся понимать текст, то значительно упростится человеко-машинный интерфейс. В сочетании с системами распознавания речи он (интерфейс) повернется на сто восемьдесят градусов: станет естественным для человека. Направление наук, занимающееся вопросом обработки текста называется «Обработка естественного языка» (NLP — Natural Language Processing). NLP очень обширен и сложен. Но дальний путь начинается с первого шага. Сделаем его. Стоп. А какой шаг надо делать первым?

Секрет правильного функционального программирования

В последнее время многие увлеклись функциональным программированием. Публикации разной степени подробности объявляют ФП панацеей от всех бед, серебряной пулей, которая спасёт индустрию создания программного обеспечения. Странно все это читать. Особенно после «великой» эпохи ООП, уже обещавшей решить все проблемы homo programmaticus. Истина находится посередине.

Функциональное программирование — дополнительный инструмент призванный решить вновь возникшие проблемы возросшего уровня сложности разработки современного программного обеспечения.

Примеры демонстрирующие возможности Rust

Объектно-ориентированный анализ — это легко

В каждой хорошей книге, посвященной объектно-ориентированному программированию, отводится особая роль первым этапам разработки программы — проведение анализа задачи и выделение классов. Справедливо отмечается критическая зависимость качества результирующего программного продукта от качества проведения этих этапов. Хорошо проведенный анализ и качественные классы уже трудно испортить в дальнейшем. Плохой анализ рождает плохие классы и никогда не позволит построить хороший программный продукт, даже если подключить первоклассных специалистов — уши плохого анализа проблемы будут торчать даже из документации и инсталятора.

Опытные специалисты проводят анализ задачи и выделение классов не задумываясь. Для начинающего программиста эти этапы являются очень трудоемким и часто становится непреодолимыми — превращаясь в шаманство. На самом деле ничего сложного в этих этапах нет. Както-то я познакомился, уже даже и не помню где, с методикой, которую я успешно применял в реальных коммерческих проектах, при работе с молодыми программистами.

Исправление ошибки 413 при работе git по http

Столкнулся с маленькой проблемой : невозможно добавить в новый репозитарий git файлы проекта.

Свежеустановленный ScmManager 1.51 под стандартным tomcat8 для Debian 8.6. Для упрощения управления всей кухней web (несколько приложений на одном сервере) запускаю все это через nginx/1.6.2 (так-же стандартный из Debian 8.6).

Новый репозиторий создается без проблем. Мелкие файлы добавляются без проблем. При добавлении большого количества файлов или большого файла, неважно, комманда git push завершается с ошибкой: «RPC failed; result=22, HTTP code = 413 …»

Причина — недостаточные размеры буферов для приема тела PUT и POST запросов как в tomcat так и в NGINX.

Лечение.
Для Tomcat — в server.xml в теге ‘<Connector port=»8080″ protocol=»HTTP/1.1″‘ устанавливаем параметр maxHttpHeaderSize=»32768″.
Для nginx — в nginx.conf в разделе http добавляем параметр «client_max_body_size 32M;».
Со значениями параметров не экспериментировал.

Перезапускаем сервера. Удаленные репозитарии git работают без проблем.

Не хочу работать на дядю.

Здравствуйте дорогие читатели blog[dot]pudgy.

«Не хочу работать на дядю, буду работать на себя». Простая и емкая фраза. Сулит золотые горы. Тысячи людей попадают под ее очарование. Резко и бесповоротно меняют свою жизнь. И что в результате? А в результате загубленные карьеры и даже судьбы. В лучшем случае безвозвратно потерянное время.

Вы скажете приобретен опыт. Но опыт приобретенный в блужданиях по дебрям заблуждений только один — не попадать туда.

Ведь если разобраться — фраза лжива. Она не указывает путь к счастливому будущему, наоборот, сбивает на неверную тропу ведущую в дебри заблуждений, ведущую в никуда. Так что в ней не так?

Разработка блога. Вначале было слово.

Вначале было слово….
Библия

Здравствуйте дорогие читатели blog[dot]pudgy.ru!

Не было печали, купила бабка… Решил я завести блог. Зачем — пока опустим. Сегодня я опишу начало моей работы над блогом. И начну не с выбора CMS или хостинга, html разметки или тем статей. Начну с самого начала — проекта. О чем напишу цикл статей, посвященных проектированию информационных систем на основе создания блога. В этом цикле статей я рассмотрю простые правила и методики наработанные в инженерной практике. Покажу как и почему их не только можно, но и нужно применять даже для решения таких задач, как создание личного блога.

Мнение о школе блогеров Александра Борисова

Знакомясь с блогосферой, столкнулся с школой блогеров Александра Борисова. Как и вокруг всего, выделяющегося на общем фоне, блогосфера полнится, как положительными отзывами, так и уничижительными мнениями. К Александру можно по всякому относится, но одного отрицать нельзя: с его приходом в блогосферу пришел профессиональный бизнесмен от слова «делать деньги».

И с этим событием я хочу всех поздравить.

Чем же примечательно явление Александра блогосфере.