Tags: NLP-семинар

Анализ текста на естественном языке, управляемый вариантами разбора

Уважаемые коллеги,

19 мая состоится заключительный семинар по автоматической обработке естественного языка в этом сезоне.

С докладом на тему "Анализ текста на естественном языке, управляемый вариантами разбора" выступит аспирант факультета вычислительной математики и кибернетики МГУ Алексей Носков.

Общепринятой схемой обработки теста на естественном языке (ЕЯ) является последовательность независимых этапов его анализа на основных уровнях, включая графематический, морфологический и синтаксический анализ. На каждом этапе в общем случае возникают многочисленные варианты разбора отдельных единиц текста, окончательный выбор между которыми часто может быть сделан только на последующих этапах, что представляет одну из сложностей обработки ЕЯ и приводит к появлению промежуточных этапов, таких как постморфология.
В докладе рассматривается подход к обработке текстов на ЕЯ, в рамках которого варианты разбора, возникающие на основных этапах анализа, обрабатываются последовательно, а сами этапы анализа выполняются одновременно. Подход иллюстрируется реализацией поверхностно-синтаксического анализа текста по лингвистическим шаблонам, подобным шаблонам языка LSPL (www.lspl.ru) и языка JAPE (системы GATE: www.gate.ac.uk).

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".

Методы построения систем автоматического анализа текста на базе лингвистических шаблонов

Уважаемые коллеги,

В субботу, 17 марта, состоится очередной семинар по автоматической обработке естественного языка.

С докладом на тему "Методы построения систем автоматического анализа текста на базе лингвистических шаблонов" выступит доцент факультета ВМиК МГУ Большакова Елена Игоревна.

В докладе будет рассмотрен класс задач автоматической обработки текста (АОТ), решаемых на базе частичного синтаксического анализа (shallow approach), и применяемые для этого методы и средства. Уточняется понятие лингвистического шаблона, характеризуется разработанный формальный язык лексико-синтаксических шаблонов LSPL и поддерживающий его программный комплекс. Анализируется опыт построения приложений на базе указанного комплекса, и обсуждаются пути создания фреймворка для быстрой разработки систем АОТ, допускающего использование сторонних модулей анализа текста на базе общей модели текстовых данных..

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".

Разработка и тестирование лингвистических процессоров в среде GATE

Дорогие друзья,

Рады вам сообщить, что в ближайшую субботу, 3 марта, мы открываем очередной сезон семинара по автоматической обработке естественного языка.

Илья Кузнецов (Центр семантических технологий НИУ ВШЭ) и Анастасия Бонч-Осмоловская (филологический факультет НИУ ВШЭ) расскажут о разработке и тестировании лингвистических процессоров в среде GATE.

В докладе будут рассмотрены возможности платформы GАТЕ, предоставляющей богатый инструментарий для работы с текстами. Речь пойдет о методах выделения объектов из текста и применимости этих методов к реальным задачам, а также о том, как оценить результат работы лингвистической системы и как интерпретировать полученные оценки.

Семинар пройдет 3.03.2012 в 17.00 по адресу: 10 линия В.О. дом 49, ауд 308.
Пароль для прохода через вахту: "Я на семинар".

P.S. Обратите внимание! Наш сайт переехал и теперь доступен по адресу nlpseminar.ru

Cross-domain Sentiment Analysis

Дорогие коллеги,

В ближайшую субботу, 17 декабря, в 17:00 состоится очередной семинар из цикла Автоматическая обработка естественного языка.

Наталья Пономарева (Statistical Cybermetrics Research group, University of Wolverhampton) прочтет доклад на тему "Cross-domain Sentiment Analysis".

Доклад посвящен проблеме автоматического анализа эмоциональной окраски текста (sentiment analysis) на примере рецензий пользователей о продуктах, взятых с сайта Amazon. Мы поговорим о методах адаптации машинных алгоритмов, обученных на корпусе рецензий об одном продукте, для классификации рецензий о другом продукте (cross-domain sentiment classification). Вначале мы представим линейную модель прогноза потери точности при cross-domain sentiment classification, базирующуюся на двух параметрах: сходстве продуктов (domain similarity) и сложности корпуса рецензий (domain complexity) для классификации эмоциональной окраски текста (sentiment classification). Во второй части доклада будет подробно рассказано об алгоритмах, основанных на графах (graph-based algorithms), и о результатах их применения к проблеме cross-domain sentiment classification.

Семинар пройдет по привычному адресу: 10 линия В.О. дом 49, ауд 308.
Пароль для прохода через вахту: "Я на семинар".

Совмещение «экспертного» и «статистического» подходов к исследованию обсуждений в блогосфере

Дорогие друзья!

В эту субботу, 3 декабря, в 17:00 состоится очередной семинар из цикла Автоматическая обработка естественного языка.

Кирилл Маслинский (Яндекс, Санкт-Петербург) выступит с докладом на тему "Совмещение «экспертного» и «статистического» подходов к исследованию обсуждений в блогосфере (на примере темы ислама)".

В докладе на примере темы ислама рассматриваются проблемы, связанные с преобразованием исследовательского представления об общественно значимой теме в процедуры автоматического отбора релевантных текстов из коллекции блогов. Кроме того обсуждаются методы оценки правомерности вычленения заданной исследователем темы и её места в структуре обсуждений в блогосфере в целом.

В работе использованы два независимых подхода для выявления общей совокупности текстов на заданную тему: традиционный «экспертный», в котором темы отбираются при помощи списка ключевых слов, составленного на основании мнений экспертов, и «статистический», когда тематическая структура текстовой коллекций блогов анализируется полностью автоматически (используется технология Topic modelling, основанная на вычислительной методике Latent dirichlet allocation).

Семинар пройдет по обычному адресу 10-ая линия В.О., дом 49, ауд. 308. Для прохода через вахту нужно сказать <<Я на семинар>>.

По-прежнему боремся с техническими трудностями и пытаемся организовать он-лайн трансляцию:
http://www.livestream.com/nlpseminar
Ее статус вы сможете узнать в нашем твиттере перед началом семинара.
https://twitter.com/nlpseminar

Автоматическое аннотирование новостного потока

Дорогие коллеги,

26-ого ноября, в субботу. в 17.00 состоится очередной семинар из цикла
Автоматическая обработка естественного языка.


Алексей Шаграев (Яндекс.Новости, Москва) расскажет об "Автоматическом
аннотировании новостного потока
".

В докладе будут рассмотрены основные задачи, связанные с
аннотированием новостного потока: составление рефератов для новостных
сообщений и сюжетов, оценка их информативности и разнообразия, а также
некоторые смежные вопросы.

Семинар пройдет по обычному адресу 10-ая линия В.О., дом 49, ауд. 308.
Для прохода через вахту нужно сказать <<Я на семинар>>.

Как обычно мы будем стараться организовать трансляцию, но, увы,
обещать не можем.
http://www.livestream.com/nlpseminar
Ее статус вы сможете узнать в нашем твиттере перед началом семинара.
https://twitter.com/nlpseminar
new
  • elada

nlpseminar 12-ого ноября - update: диалоговые AI системы

Дорогие коллеги,
в ближайшую субботу (12.10.2011) на семинаре по автоматической обработке естественного языка будет два доклада.

Первый, как и анонсировали, будет доклад Павла Гращенкова (EPAM, Москва) "Насколько устарели языковые платформы, основанные на правилах?".

Второй доклад будет посвящен диалоговым системам: "Наш ответ Siri или построение системы диалогового AI для нового продукта i-Free", его прочитает Владимир Веселов (США), создатель одного из известных ботов Eugene Goostman.

Приходите! Мне кажется, что будет очень интересно.

Начало как и планировали в 17.00. Мы очень надеемся, что будет трансляция.
Все подробности как обычно у нас на сайте: http://mathlingvo.ru/nlpseminar
new
  • elada

Насколько устарели языковые платформы, основанные на правилах?

12 ноября 2011 в 17.00 состоится очередной семинар по автоматической обработке естественного языка.

Павел Гращенков из компании Epam (Москва) расскажет "Насколько устарели языковые платформы, основанные на правилах?".

В докладе будет рассмотрена система анализа неструктурированной информации, разрабатывавшаяся в компании “ЭПАМ-Системз” для извлечения данных русского и др. языков. Система в основном используется для определения эмоциональной окраски высказывания (Sentiment Analysis) и извлечения информации, релевантной для заказчика (Data Mining).
Будут вкратце описаны основные модули системы, для каждого из которых был создан свой метаязык, и приведены примеры разбора конкретных выражений на русском языке разными модулями.
Предполагается также остановиться на преимуществах систем, основанных на правилах, перед другими типами языковых платформ.

Семинар состоится по привычному адресу: СПб, 10-ая линия В.О., дом 49, ауд. 308.

Мы попробуем поднять онлайн-трансляцию, в прошлый раз у нас даже это получилось :)
Трансляцию нужно искать здесь: http://www.livestream.com/nlpseminar, ее статус мы постараемся оперативно обновлять в твиттере

Автоматизированные методы определения эмоций и отношения потребителя к продукту

Дорогие коллеги,

В ближайшую субботу, 22 октября, в 17.00 состоится очередной семинар по автоматической обработке естественного языка.

Рубен Гиргидов расскажет об "Автоматизированных методах определения эмоций и отношения потребителя к продукту".

В настоящем исследовании рассматриваются проблемы определения смысла пользовательских сообщений и в частности их эмоциональной направленности на примере отношения к различным продуктам (сотовым телефонам, HDD и т.д.). Отношение к продуктам определялось на базе профильных (посвященных данному продукту) форумов и твиттера и мнений, опубликованных в интернет магазинах.

Как обычно, семинар пройдет по адресу: 10-ая линия В.О., дом 49, ауд. 308.
Для прохода через вахту нужно сказать <<Я на семинар>>.

Надеемся наконец-то поднять онлайн трансляцию. Для получения актуальной информации о ее состоянии следите за нашим твиттером: @nlpseminar

Получение структуры для поисковых запросов на примере товарных запросов

Уважаемые коллеги,

15 октября, в субботу, в 17.00 состоится семинар по автоматической обработке естественного языка.

Юлия Киселева из компании Яндекс расскажет о "Получении структуры для поисковых запросов на примере товарных запросов".

Аннотация:
Большое количество информации в Интернете структурировано, примерами могут служить страницы с описанием товаров на таких сайтах как Amazon.com. В то же время, запросы с "ключевыми" словами все еще являются наиболее популярным способом поиска. Понятно, что данный подход вносит неоднозначность и "шум" в результаты поиска. Описанная проблема может быть решена путем введения техники для сегментации запроса, суть которой состоит в трансформации неструктурированного запроса в структурированный. Основной вклад нашей работы - это введение нового автоматического метода сегментации запросов. Описываемый метод обучается на основе множества, формируемого путем соединения запросов пользователей и списка товаров, которые были выбраны пользователем.

Как обычно, семинар пройдет по адресу: 10-ая линия В.О., дом 49, ауд. 308.
Для прохода через вахту нужно сказать <<Я на семинар>>.