Оценка систем обработки текста

Дорогие друзья,
Наш семинар по автоматической обработке естественного языка открывает новый сезон! Ближайший доклад состоится в эту субботу, 19 октября. Александр Тарелкин (Яндекс) расскажет об оценке систем обработки текста.
Автоматическая обработка естественного языка все больше набирает обороты: развиваются старые системы, появляются новые. В этой связи все чаще возникает потребность сравнить качество той или иной системы с каким-то
предыдущим состоянием или с другими системами. На практике это может оказаться сложнее, чем кажется. В данном докладе речь пойдет об основных принципах оценки качества систем обработки естественного языка: о метриках, о подготовке данных и о самой процедуре оценки.
Семинар пройдет 19.10.2013 в 17.00 по адресу: 10 линия В.О. дом 49, ауд 308.
Пароль для прохода через вахту: "Я на семинар".
alter ego

Russir: последние дни приема заявок

Через 10 дней заканчивается прием заявок на RuSSIR 2013 (http://russir.org). Школа пройдет в Казани 16-20 сентября. Как обычно, программа крутая (включая 3 курса по обработке и поиску музыки), участие - бесплатное. Торопись сами и распространите информацию среди друзей, знакомый и коллег!

Помимо информационного письма (под катом) у нас есть:
- статья с разъяснениями, что нужно сделать для того, чтобы поучаствовать в школе: http://habrahabr.ru/post/179855/
- плакат (можно распечатать и повесить): https://dl.dropboxusercontent.com/u/59208962/russir2013_poster_ru_upd.pdf

                                                                     
 

Collapse )

(no subject)

Дорогие друзья,
Очередной семинар по автоматической обработке естественного языка состоится уже в эту пятницу, 29 марта. Докладчик - Дмитрий Кан (Principal NLP Search Engineer, AlphaSense Inc.)
В докладе будет представлен краудсорсинг проект, ориентированный на построение и улучшение системы машинного перевода. Отличительной чертой является применение компьютерной семантики русского языка. Мы также рассмотрим статистический метод автоматической генерации переводных словарей.
Проект MTEngine: http://semanticanalyzer.info/mtengine/
ВНИМАНИЕ! Семинар пройдет в офисе Яндекса по адресу Пискаревский проспект, д. 2, БЦ Бенуа. Начало в 19:00. Для участия в семинаре необходима предварительная регистрация.
Регистрация открыта до 15:00 28.03.13.
Напоминаем, как можно добраться до Яндекса:
От метро "площадь Ленина" до БЦ Бенуа ходят бесплатные автобусы, остановка здесь: http://maps.yandex.ru/?um=rfRyE55pZkfxmq1lDqXiPUfx79ZC7-V8&l=map
Автобусы ходят каждые 12 минут: 18:12, 18:24, 18:36, 18:48 и т.д.
Чтобы вас пропустили внутрь, надо подойти к охранникам на первом этаже и сказать, что вы в Яндекс на семинар. На всякий случай надо взять с собой паспорт.

SciNet: Эксплоративный поиск научной литературы

Дорогие друзья,
Рады вам сообщить, что мы открываем новый сезон цикла семинаров по автоматической обработке естественного языка.
Ближайший доклад состоится в этот четверг, 28 февраля. Ксения Конюшкова расскажет нам про эксплоративный поиск научной литературы.
Ксенией и её коллегами была разработана интерактивная поисковая система научных статей, которая совмещает в себе методы обучения с подкреплением (Reinforcement Machine Learning) и оригинальный интерфейс для того, чтобы активно вовлечь пользователя в управление поисковой сессией. Основная цель системы это исследование информационного пространства, поэтому система позволяет не только найти релевантные документы, но и понять сферу исследований. Данный инструмент предназначен в первую очередь для ситуаций, когда пользователь недостаточно глубоко знаком со сферой поиска или затрудняется сформулировать свой запрос. Эксплоративный подход позволяет предолеть некоторые из проблем традиционного поиска, например, такие как смещение пользовательского акцента поиска.
Пользователь идентифицирует свой поисковый интерес, напрямую манипулируя признаками документов (в данном случае, ключевыми словами), что позволяет спрогнозировать его модель с использованием алгоритмов многоруких бандитов (multi-armed bandits). Была предложена модель визуализации интересов пользователя и предсказанных намерений для него в виде радара, что дает ему возможность эффективно управлять поисковой сессией в любых направлениях. В отличние от стандартного полнотекстового поиска, база документов не статична и меняется на каждой итерации. Кроме того, используемые методы построения модели пользователя могут применяться и в других приложениях, что и было продемонстрировано на примере интерактивного поиска изображений.
Было проведено юзабилити-тестирование системы с 30 участниками, где сравнивались  показатели точности, полноты, F-мера, а также удобство использования традиционной и разработанной системы. Исследования подтвердили, что интерактивная поисковая система значительно превосходит традиционную по своей эффективности, предоставляя пользователю доступ к большему количеству релевантной и оригинальной информации, сохраняя при этом ту же точность.

ВНИМАНИЕ!

Семинар пройдет в офисе Яндекса по адресу Пискаревский проспект, д. 2, БЦ Бенуа. Начало в 19:00. Для участия в семинаре необходима предварительная регистрация.
Регистрация открыта до 15:00 27.02.13.
Напоминаем, как можно добраться до Яндекса:
От метро "площадь Ленина" до БЦ Бенуа ходят бесплатные автобусы, остановка здесь: http://maps.yandex.ru/?um=rfRyE55pZkfxmq1lDqXiPUfx79ZC7-V8&l=map
Автобусы ходят каждые 12 минут: 18:12, 18:24, 18:36, 18:48 и т.д.
Чтобы вас пропустили внутрь, надо подойти к охранникам на первом этаже и сказать, что вы в Яндекс на семинар. На всякий случай надо взять с собой паспорт.
alter ego

AINL 2013: Call for Papers



О конференции

Приглашаем принять участие во второй конференции AINL: “Искусственный интеллект и естественный язык”, которая состоится в 17-18 мая 2013 года в Санкт-Петербурге. Основная цель мероприятия — обсудить последние продукты и разработки, обменяться опытом, найти возможные варианты сотрудничества. Конференция организована NLPseminar и компанией i-Free.

Первая конференция AINL прошла 26 мая 2012 года в Санкт-Петербурге с большим успехом.В конференции приняли участие представители ведущих российских компаний, научных коллективов и высших учебных заведений.

Тематики AINL 2013
  • Искусственный интеллект и интеллектуальные агенты
  • Речевые технологии
  • Инженерия знаний, linked data
  • Text mining
  • Лингвистические технологии, в том числе машинный перевод

Участникам

Мы приглашаем принять участие в конференции представителей компаний, работающих в сфере интеллектуальных технологий, разработчиков профильных проектов, участников научных групп, студентов и аспирантов.

Работы будут приниматься в трех основных треках:
  • Технологии и научно-прикладные исследования
  • Проекты, связанные с AI и NL
  • Демо-секция

Чтобы принять участие в конференции, необходимо подать заявку до 1 марта 2013 года.

Заявка должна содержать:

ФИО, должность, место работы или учебы
Краткую биографию докладчика (50 слов), ссылки на профили в соц.сетях
Тезисы доклада, объемом до 600 слов
Форма представление работы: устный доклад или постер

Каждая работа будет отрецензирована как минимум двумя членами программного комитета. Рабочие языки мероприятия: русский и английский.

Форма подачи заявок будет в ближайшее время опубликована на сайте конференции.

http://nlpseminar.ru/ainl/
                                         
alter ego

CFP: Balto-Slavic Natural Language Processing

4-й воркшоп по автоматическому анализу текста для славянских и балтийских языков (BSNLP 2013 ) пройдет в рамках конференции ACL 8-9-го августа, в Софии (Болгария).

Воркшоп посвящен актуальным вопросам автоматической обработки текста для балтийских и славянских языков, включая следующие задачи:

морфологический анализ и синтез
синтаксическая и семантическая разметка
выделение именованных сущностей
извлечение информации
разрешение кореференции
автоматические ответы на вопросы
информационный поиск
автоматическое реферирование
машинный перевод
и т.д.

К участию принимаются полные и короткие статьи на английском языке. Полные статьи описывают законченные, оригинальные, ранее не публиковавшиеся исследования. Короткие статьи могут описывать незаконченные работы и/или интерактивные демонстрации ПО. Особенно приветствуются работы, посвященные общедоступным системам, ресурсам и инструментам.

И полные, и краткие статьи будут отбираться по результатам слепого рецензирования. Принятые работы будут опубликованы как ACL Workshop Proceedings. Лучшие работы этого и предыдущих воркшопов затем планируется опубликовать в виде расширенных статей в специальном сборнике.

Даты:

Paper submissions due: 26 April 2013
Notification of acceptance: 24 May 2013
Camera-ready versions due: 7 June 2014
Workshop: 8 or 9 August 2013

Более подробную информацию можно найти на сайте: http://puls.cs.helsinki.fi/bsnlp-2013/index.html

  • n0mad_0

Вакансия прикладного исследователя в области Data Mining/Information Retrieval

Мы приглашаем в нашу команду начинающих и опытных исследователей (data scientists/applied researchers). Для нас важно, чтобы вы не только придумывали и разрабатывали новые методы обработки и поиска информации, но и могли описывать свои решения в статьях уровня ведущих академических конференций — например, SIGIR, WWW, WSDM, CIKM, KDD, ACL и им подобных.

ссылка на вакансию
http://company.yandex.ru/job/vacancies/res_dmir.xml

условия работы в яндексе
http://company.yandex.ru/job/vacancies/ask.xml

У кого что болит? Анализ социальных вопросно-ответных сервисов по медицинской тематике

Уважаемые коллеги,
В следующий четверг, 13 декабря, состоится внеочередной семинар по обработке естественного языка. К нам приезжает Павел Браславский (Kontur labs/Уральский федеральный университет) с докладом на тему "У кого что болит? Анализ социальных вопросно-ответных сервисов по медицинской тематике".
Социальные вопросно-ответные сервисы (community question answering, CQA) позволяют пользователям задавать вопросы другим членам сообщества, отвечать на вопросы, оценивать вопросы и ответы, а также зарабатывать баллы. Люди обращаются к этим сервисам, когда сталкиваются с информационной потребностью, которую непросто выразить в виде короткого запроса, когда хотят получить персонифицированный "человеческий ответ" или просто поболтать. Павел расскажет об экспериментах, которые они провели на данных сервиса Ответы@Mail.Ru, относящихся к теме "Медицина и здоровье", а также о ближайших планах работы с данными CQA.
Кроме того, Павел расскажет нам о новых инициативах РОМИПа.
ВНИМАНИЕ!
Семинар пройдет в офисе Яндекса по адресу Пискаревский проспект, д. 2, БЦ Бенуа. Начало в 19:00. Для участия в семинаре необходима предварительная регистрация. Регистрация открыта до 12:00 12.12.12.

На каком языке этот текст? Ответ математиков

Дорогие коллеги,
В субботу, 8 декабря, на семинаре по обработке естественного языка выступит Эдуард Клышинский (ВШЭ, Москва) с докладом на тему "На каком языке этот текст? Ответ математиков".

В докладе будут рассмотрены методы автоматического определения языка, на котором написан текст. Также рассматриваются различные решения задачи определение языка, которому принадлежит имя собственное.

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.
Пароль для прохода через вахту: "Я на семинар".
kitchen
  • vnat

9-ый весенний коллоквиум по базам данных и информационным системам (SYRCoDIS'2013)

Приглашение к участию в коллоквиуме. Хорошая возможность для студентов и аспирантов попробовать свои силы в написании статей и выступлении на английском языке. Плюс возможность получить публикацию в ВАКовском журнале.

The 9th Spring Researchers Colloquium on Databases and Information Systems (SYRCoDIS 2013), May 30-31, 2013, Kazan, Russia
http://syrcodis.ispras.ru/2013
syrcodis2013@ispras.ru

Submission deadline: January 20, 2013
Notification: March 15, 2013
Camera-ready deadline: April 5, 2013
Colloquium: May 30-31, 2013

Collapse )