Tags: machine learning

  • sasha_2

Как учесть в классификаторе требование монотонности по отдельному параметру ?

Иногда при построении классификатора (например, на базе метода SVМ) требуется обеспечить "физическое" требование монотонности изменения метки (label) при изменении значения какого-то отдельного параметра. Пример - если классификатор наличия-отсутствия диабета в зависимости от значений ряда входных параметров дал выходное значение "да" при уровне сахара 120, то ясно, что он должен давать такое же выходное значение при уровне сахара больше 120. И наооборот, если он дал выходное значение "нет", то должен давать такое же выходное значение при уровне сахара меньше 120 (при неизменных значениях остальных входных параметров). Подскажите, пожалуйста, существуют ли какие-нибудь подходы к решению подобных задач? Заранее спасибо.
alter ego

lucene+weka на nlpseminar

4 декабря в 17.00 на нашем семинаре состоится доклад Александра Кузнецова (Grid Dynamics, Саратов) об опыте построение поиска объявлений об одинаковых товарах с помощью opensource-технологий.

В докладе будет рассказано о том, каким образом можно построить поиск одинаковых объявлений в определенной категории товаров, используя библиотеки с открытым исходным кодом, такие как lucene (information retrieval) и weka (machine learning). Также будет детально описана архитектура приложения, которое ищет совпадающие объявления, и дан краткий обзор возможностей задействованных библиотек.

Семинар пройдет как обычно по адресу 10-ая линия В.О., дом 49, 3 этаж, аудитория 308.

Я знаю, кое-кто тут хочет меня спросить об интернет-трансляции. технологию мы уже освоили, но в прошлый раз вмешался человеческий фактор: я забыла дома ноутбук. Постараюсь больше так не делать.
Адрес трансляции: http://www.livestream.com/nlpseminar
 
alter ego

два семинара на этой неделе

Дорогие друзья! На этой неделе состоится сразу два семинара по
автоматической обработке текста
.

16 ноября ЭТАПЫ СОЗДАНИЯ СТАТИСТИЧЕСКОГО ПЕРЕВОДЧИКА ПОТОКОВ НОВОСТЕЙ
Дмитрий Ландэ (Информационный центр <<ЭЛВИСТИ>>, Киев, Украина)

При создании статистических переводчиков с близких по структуре языков
(например, русско-украинского) решается ряд задач, имеющих важное
значение для таких приложений, как автоматическое выявление опорных
(ключевых) слов в документах, выявление дубликатов документов
(плагиата), представленных на различных языках, построение корпусов
параллельных текстовых документов, предложений, n-грамм, и, наконец,
создания автоматических переводчиков.
В докладе описана методология создания <<самообучаемого>>
статистического переводчика, ориентированного на массовый перевод
текстовой информации из информационных потоков.

Внимание! Начала семинара 16:40, просьба не опаздывать. И это не
суббота, а вторник.

20 ноября Об одном методе автоматической транскрипции
Варвара Логачева (ИПМ им. М.В.Келдыша РАН, Москва)

В докладе идет речь об одном из подходов к решению задачи машинной
транскрипции имен собственных с использованием конечного автомата для
преобразования строк. Также рассматривается метод автоматического
создания системы правил для подобной передачи.

Начало семинара - 17:00.

Адрес: 10-ая линия В.О., дом 49, ауд. 308. Для прохода через вахту
нужно сказать <<Я на семинар>>.

Приносим свои извинения за поздний анонс.