?

Log in

Информационный поиск [entries|archive|friends|userinfo]
Информационный поиск

[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Новая версия NMSLIB [May. 24th, 2016|03:12 pm]
Информационный поиск

itman
[Tags|, ]

Наша эффективная библиотека NMSLIB для k-NN поиска в общих пространствах дожила до версии 1.5. Благодаря моим коллегам Юре Малькову и Дэвиду Новаку, удалось значительно улучшить производительность (очень неплохие результаты в сравнение с LSH и random projections kd-tree). Особенно заметен выигрыш для векторных пространств средней размерности. Более детальное описание релиза можно найти по этой ссылке. Высказать одобрение (или негодование) можно здесь и/или в GitHub репозитории.
Link2 comments|Leave a comment

Multiple funded PhD student positions at Emory University Computer [Dec. 4th, 2015|08:11 pm]
Информационный поиск

itman
[Tags|]

Emory University Computer Science & Informatics (CSI) program is inviting applications for Ph.D. and MS studies for the Fall of 2016. The application deadline is January 3rd, 2016. The CSI Ph.D. program was officially established in 2007, and currently has over 50 Ph.D. and M.S. students, with all graduates landing great positions in industry and academia. The program is starting another period of rapid growth, with the goal of doubling the number of graduate students. More information about the Emory CSI program is at: http://csi.mathcs.emory.edu/

Read more...Collapse )
LinkLeave a comment

11-точечный график [May. 21st, 2015|02:26 pm]
Информационный поиск

l_i_d_y_a
[Tags|, ]

Добрый день,

У меня вопрос по 11-ти точечному графику полнота-точность.
Вот этот график из известного учебника:



Объясните, пожалуйста, почему там, где полнота 0, точность уже меньше единицы? Каким образом это начальное значение посчитать?

И почему на простом графике полнота-точность из той же книжки там, где полнота 0, точность все-таки 1.



Это какая-то ошибка в 11-ти точечной картинке? Или я чего-то не понимаю?

Заранее большое спасибо за ответы!
    
Link3 comments|Leave a comment

Сеанс качественного машинного перевода с последующим разоблачением [Apr. 6th, 2015|05:22 pm]
Информационный поиск

nataxane
[Tags|]

Дорогие друзья,
В эту субботу, 11 апреля, состоится заседание нашего семинара по автоматической обработке естественного языка. Доклад с интригующим названием "Сеанс качественного машинного перевода с последующим разоблачением" прочтёт нам магистр лингвистики, разработчик ПО из компании JetBrains Пётр Громов.
Программа constructor переводит творчество Хармса на английский язык не хуже переводчика-человека. Используя грамматику конструкций для синтаксического анализа, она строит промежуточное, чисто семантическое представление текста. Понимание программой смысла текста помогает в разрешении неоднозначностей. Автор покажет программу в действии и расскажет, как она устроена внутри; в частности, как она обрабатывает эллипсис, местоимения и другие интересные конструкции русского языка.

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.

Пароль для прохода через вахту: "Я на семинар".

LinkLeave a comment

RUSSIR & SISAP 15 [Mar. 26th, 2015|07:10 pm]
Информационный поиск

itman
[Tags|, ]

Хотелось бы напомнить про два надвигающихся события: Российская школа по информационному поиску (RUSSIR) и 8th International Conference on Similarity Search and Applications (SISAP) 2015.

RUSSIR пройдет в Питере, крайний срок подачи заявок 20 апреля. Если есть желание прочесть курс, то нужно подать заявку до 30-го марта. Подробности на этой странице.

SISAP (конференция на тему поиска по сходству). Пройдет в Глазго. Срок подачи abstract до 4-го мая, срок подачи статьи до 11-го мая. Подробности здесь. Как я уже писал раньше, одно из преимуществ подачи на SISAP заключается в том, что вероятность принятия good enough paper близка к 100% (ну и тема, конечно же, интересная).
LinkLeave a comment

Про семантический Веб [Sep. 9th, 2014|01:21 pm]
Информационный поиск

itman
[Tags|]

Приветствую, всегда считал, что семантический Веб это RDF с полезной информацией, вроде онтологий, адресов магизинов, и пр.., которую можно извлекать и по которой можно искать. Решил копнуть поглубже и, мама дорогая, там такое полезло. Вроде чуть ли не основные статьи на тему умного service matching.

Но я подозреваю, что, все-таки, RDF-поиск, лингвистика, и пр... тоже должны как-то ведь быть представлены. Никто не припомнит хорошего обзора на данную тему? Искал, но пока не нашел.

Спасибо!
Link24 comments|Leave a comment

Минутка бесстыдной рекламы: библиотека для поиска в общих пространствах [Jul. 15th, 2014|08:40 pm]
Информационный поиск

itman
[Tags|, ]

Мой соавтор Билег и я последний год довольно интенсивно работали над библиотекой для поиска по сходству в общих пространствах (чтоб работало не только в метрических пространствах). У нас появились первые пользователи и код наш стал достаточно стабильным. А большую часть можно даже запустить под Виндоуз.

Поэтому мы решили сделать "официальный" релиз этой относительно стабильной версии. С блэкджеком, тестами, и документацией.

Основные программные пункты изложены в моем английском блоге.

Имеет, наверное, смысл повторить, что основная наша задача был создать не только и не столько библиотеку, а фреймворк, в который относительно легко добавить новый метод и сравнить с уже существующими.

В последнее время было опубликовано множество методов, но на практике они редко существенно обгоняют простенькие VP-trees (если обгоняют вообще). Поэтому особенно важно иметь возможность сравнить с относительно простыми, но быстрыми методами.

В число таких методов входят (полный список методов несколько длинее):
1) VP-tree с простенькой настраивемой функцией для pruning (может неплохо работать и в неметрических пространствах).
2) Multiprobe (LSH).
3) k-NN graph методы.
4) Простенькие методы сокращения размерности путем трансформации в вектор расстояний до опорных точек.

В будущем, мы будем пополнять список бенчмарков. Есть есть несколько важных методов, которые мы пока не реализовали.

Ну и кроме самих методов особенное внимание уделялось эффективной реализации функций похожести. Так, например, скалярное произведение мы можем считать в 2.5-3 раза быстрее стандартной реализации (думаю, что можно считать раз в 10 быстрее, но это оптимизации на будущее), а KL-divergence или JS-divergence считается в 2-20 раз быстрее (в зависимости от компилятора).

По-крайней мере, с точки зрения публикабельности, библиотека оказалась весьма полезна (мы с ней даже на NIPS проползли). Возможно, она окажется полезна не только нам.
LinkLeave a comment

Руссир начал прием заявок [May. 30th, 2014|11:09 am]
Информационный поиск

l_i_d_y_a
[Tags|]

Руссир - это международная школа по информационному поиску, которая традиционно (восьмой год) проходит в России. Это уникальная возможность поучиться у ведущих специалистов в области не уезжая далеко от дома. В этом году школа проходит в Нижнем Новгороде.
Школа будет полезна как студентам-старшекурсникам, там и аспирантам и молодым специалистам, да вообще всем, кто хочет повысить свою квалификацию.
Участие в школе бесплатное, имеется ограниченное количество грантов на проживание. Обязательным условием является участие в постерной секции. При подаче заявки на школу надо подать 2-х страничные тезисы работы, которая будет представлена в виде постера. При отборе заявок учитывается качество этих тезисов и их релевантность основным тематикам школы.
Кроме того, при школе организуется конференция молодых ученых. Статьи, отобранные на конференцию, будут опубликованы в издательстве Springer. Участие в конференции становится весомым аргументом при распределении грантов на проживание.

подробное приглашение к участиюCollapse )
Link1 comment|Leave a comment

Успешная публикация в международных научных журналах и на конференциях [Apr. 22nd, 2014|11:21 am]
Информационный поиск

nataxane
[Tags|]

Дорогие коллеги,
В ближайшую субботу, 26 апреля, состоится очередной семинар по автоматической обработке естественного языка. Наталья Константинова выступит с докладом на тему "Успешные публикации в международных научных журналах и на конференциях".

Где и зачем публиковаться? На семинаре мы обсудим возможные альтернативы в выборе места публикаций, разберем то, что должно влиять на этот выбор и что стоит учитывать. Мы рассмотрим стандартную процедуру рецензирования как на конференциях, так и в журналах. Презентация поможет наглядно разобрать стандартную структуру научных статей и избежать возможные ошибки. Данная презентация будет полезна как начинающим свою научную карьеру студентам, так и старшим научным сотрудникам, которые планируют более активно публиковаться в зарубежных источниках.

Наталья закончила кафедру математической лингвистики в СПбГУ и получила PhD в University of Wolverhampton (UK). Ее интересы охватывают такие области NLP, как извлечение информации, онтологии, машинный перевод и интерактивные вопросно-ответные системы. Она также проявляет интерес к машинному обучению и рекомендательным системам. Уже на протяжении 5 лет Наталья является помощником редактора научного журнала, издаваемого престижным Cambridge University Press. Она имеет обширный опыт организации конференций и рецензирования научных статей.

Семинар пройдет по адресу: 10 линия В.О. дом 49, ауд 308. Начало в 17:00.

Пароль для прохода через вахту: "Я на семинар".
LinkLeave a comment

Russir: call for courses [Jan. 28th, 2014|10:47 am]
Информационный поиск

l_i_d_y_a
[Tags|]

   8th Russian Summer School in Information Retrieval (RuSSIR 2014)
              Monday August 18 - Friday August 22, 2014
                       Nizhny Novgorod, Russia
                          http://russir.org

                    1ST CALL FOR COURSE PROPOSALS

Course proposals deadline: 9 March 2014

The 8th Russian Summer School in Information Retrieval (RuSSIR 2014)
will be held on August 18-22, 2014 in Nizhny Novgorod, Russia. The
school is co-organized by the National Research University Higher
School of Economics in Nizhny Novgorod (http://nnov.hse.ru/en/) and
the Russian Information Retrieval Evaluation Seminar (ROMIP,
http://romip.ru/en/). RuSSIR 2014 is planned to have an additional
focus on visualization for IR.

The missions of the RuSSIR school series are to enable students to
learn about modern problems and methods in information retrieval and
related disciplines; to stimulate scientific research and collaboration
in the field; and to create an environment for informal contacts
between scientists, students and industry professionals.

RuSSIR 2014 will offer up to seven courses and host approximately 100
participants. The target audience of the school is advanced graduate
and PhD students, academic and industrial researchers, and developers.
The working language of the school is English.

RuSSIR 2014 welcomes course proposals on any aspect of IR theory and
applications, as well as visualization for IR including, but not
limited to:
 - IR models
 - Web and social media IR
 - System architectures and scalability
 - Content representation and analysis
 - User aspects and interaction models for IR
 - Multimedia IR
 - Evaluation and user studies
 - Information visualization methods
 - Text analytics
 - Visual analytics
 - Perceptual and cognitive aspects
 - Applications

read moreCollapse )
Пожалуйста, распространите информацию среди заинтересованных коллег.
                        
LinkLeave a comment

navigation
[ viewing | most recent entries ]
[ go | earlier ]