Ilya Segalovich ([info]iseg) wrote in [info]ru_ir,

Чего в "этом супе" не хватает?


Книжки по информационному поиску в библиотеке Яндекса Книжки по информационному поиску

Меня просили показать библиотеку Яндекса с книжками по IR. Часть книг - на руках (процентов 15-20), но кое-что стоит на полке.
Таки чего "в этом супе" не хватает по вашему мнению?


  • Post a new comment

    Error

  • 42 comments

[info]mr_pasechnik

September 21 2006, 10:27:39 UTC 5 years ago

C большим интересом рассмотрел полку, но названия некоторых книг снизу прочитать невозможно. :(
Можно ли списком с названиями и авторами?

[info]iseg

September 21 2006, 10:43:44 UTC 5 years ago

может быть еще и с аннотациями? :-) (на вопросы про конкретные книги могу дать ответ)

Преамбула: список неполон, части русских книг нет.

Cобственно поиск и веб-поиск



  • ***; Information Retrieval
  • ***; Modern Information Retrieval
  • Karen Sparck Jones, et al; Readings in Information Retrieval
  • Ian H. Witten, et al; Managing Gigabytes: Compressing and Indexing Documents and Images
  • Michael W. Berry, Murray Browne; Understanding Search Engines : Mathematical Modeling and Text Retrieval
  • Soumen Chakrabarti; Mining the Web: Analysis of Hypertext and Semi Structured Data
  • Stefano Leonardi (ed); Algorithms and Models for the Web-Graph
  • Gary Marchionini; Information Seeking in Electronic Environments
  • C. J. van Rijsbergen; The Geometry of Information Retrieval
  • David A. Grossman; Information Retrieval: Algorithms and Heuristics
  • G. G. Chowdhury;Introduction to Modern Information Retrieval
  • Charles T. Meadow;Text Information Retrieval Systems

    обработка естественного языка



  • Christopher D. Manning, Hinrich Schutze; Foundations of Statistical Natural Language Processing
  • Daniel Jurafsky; Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition
  • Tomek Strzalkowski; Natural Language Information Retrieval
  • Peter Jackson; Natural Language Processing for Online Applications: Text Retrieval, Extraction, and Categorization

    Аннотирование, кластеризация в информационном поиске



  • Inderjeet Mani, Mark T. Maybury; Advances in Automatic Text Summarization
  • Marie-Francine Moens; Automatic Indexing and Abstracting of Document Texts
  • James Allan (ed.); Topic Detection and Tracking
  • Weili Wu; Clustering and Information Retrieval

    Машинное обучение (классификация, Data-mining, искусственный интеллект)


  • Stuart J. Russell; Artificial Intelligence: A Modern Approach
  • Ethem Alpaydin; Introduction to Machine Learning (Adaptive Computation and Machine Learning)
  • Ian H. Witten; Data Mining: Practical Machine Learning Tools and Techniques
  • Dorian Pyle; Data Preparation for Data Mining

    Поиск и классификация изображений по содержанию


  • Vittorio Castelli; Image Databases : Search and Retrieval of Digital Imagery
  • Corinne Jorgensen; Image Retrieval: Theory and Research

    Алгоритмы работы со строками


  • Dan Gusfield; Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology
  • Дэн Гасфилд; Строки, деревья и последовательности в алгоритмах. Информатика и вычислительная биология
  • Gonzalo Navarro; Flexible Pattern Matching in Strings
  • Christian Charras; Handbook of Exact String Matching Algorithms
  • Maxime Crochemore; Jewels of Stringology Попов Дмитрий

    Социальные сети


  • Stanley Wasserman. Social Network Analysis : Methods and Applications
  • John P Scott. Social Network Analysis: A Handbook

    Прочие алгоритмы, трюки, полезности



  • Robert Sedgewick; Algorithms in C++
  • ***; Алгоритмические трюки для программистов
  • ***; Графы в программировании: обработка, визуализация и применение
  • Д. Бентли; Жемчужины программирования (2-е изд)
  • Д. Бентли; Жемчужины творчества программистов (1-е изд)
  • ***; Основы многопоточного, параллельного и распределенного программирования
  • ***; Практика программирования
  • К. Касперский; Техника оптимизации программ. Эффективное использование памяти


    Задачки для приема на работу


  • William Poundstone; How Would You Move Mount Fuji? Microsoft's Cult of the Puzzle – How the World's Smartest Company Selects the Most Creative Thinkers
  • John Mongan; Programming Interviews Exposed: Secrets to Landing Your Next Job

    i18n и лингвистка


  • ***; The Unicode Standard, version 2.0
  • Зализняк А.А.; Грамматический словарь русского языка
  • Ruslan Mitkov; The Oxford Handbook of Computational Linguistics
  • [info]rusl

    September 21 2006, 10:33:08 UTC 5 years ago

    Из русскоязычных не помешали бы труды RCDL и РОМИП. Той же Интернет-математики Яндекса тоже не видно.

    [info]iseg

    September 21 2006, 10:44:22 UTC 5 years ago

    есть - выше. на одну полку не влезло. вообще в библиотеке занято много полок

    [info]gorynych

    September 21 2006, 10:34:20 UTC 5 years ago

    читабельности названий :-)

    [info]iseg

    September 21 2006, 10:44:32 UTC 5 years ago

    см коммент

    Anonymous

    September 21 2006, 18:56:33 UTC 5 years ago

    как насчет ...

    трудов SIGIR (вроде ведь не все доступно в ACM DL?)
    Information Processing & Management (содержание можно посмотреть тут - http://www.sciencedirect.com/science/journal/03064573)

    [info]iseg

    September 22 2006, 07:08:08 UTC 5 years ago

    Re: как насчет ...

    доступны конечно

    [info]iseg

    September 22 2006, 07:08:57 UTC 5 years ago

    Re: как насчет ...

    ipm и jassist - оба дорогие и в dl не входят, это правда.

    [info]itman

    September 22 2006, 06:52:17 UTC 5 years ago

    Не хватает практически всего
    * Подписки на ведущие журналы, в частности на журналы ACM (хотя бы в электронном виде)
    * Трудов конференций, в частности SIGIR и VLDB (хотя бы в электронном виде)
    * Свободного времени, чтобы это читать и проверять на практике
    * Очень мало книжек по поиску изображений

    [info]iseg

    September 22 2006, 07:07:43 UTC 5 years ago

    1 и 2 есть в подписке на acm dl (для россии примерно 40 долларов в год вместе с членством в acm и редиректящим e-mail-ом itman@acm.org. смешно, правда?)
    3 - согласен
    4 - каких?

    [info]itman

    September 22 2006, 07:13:12 UTC 5 years ago

    То есть ты хочешь сказать, что разработчик должен заплатить 40 долларов из своей зарплаты за членство в ACM и еще по 50 за пару других журналов? Знаешь как это называется?

    [info]iseg

    5 years ago

    [info]itman

    5 years ago

    [info]iseg

    5 years ago

    [info]itman

    5 years ago

    [info]iseg

    5 years ago

    Anonymous

    5 years ago

    [info]iseg

    5 years ago

    [info]itman

    5 years ago

    [info]iseg

    5 years ago

    [info]itman

    5 years ago

    [info]vnat

    September 22 2006, 08:34:15 UTC 5 years ago

    К книгам по поиску изображений по содержанию добавила бы книги по обработке оных. Невозможно разрабатывать алгоритмы CBIR, не зная что и как можно делать с содержанием картинок.

    У меня есть две любимых книги в этой области, считай библии:

    Digital Image Processing, R. Gonzalez, R.Woods - в 2002 вышло второе издание, а в 2005 - издали на русском языке, изд. Техносфера. Перевод вполне пристойный.

    Digital Image Processing, Kenneth R.Castleman, 1995 - немного фундаментальнее первой, больше математики.

    В принципе, наверно достаточно одной из них.

    [info]iseg

    September 22 2006, 09:46:14 UTC 5 years ago

    спасибо большое - закажу обязательно
    (а вы заняты cbir?)

    [info]vnat

    September 23 2006, 07:40:21 UTC 5 years ago

    да не за что :)

    Да, я занимаюсь CBIR. Как говорится, "я не волшебник, я еще только учусь", но надеюсь что когда-нибудь все-таки защищу кандидатскую на основе своих исследований. И исследования на этом не закончатся :)

    Мы, кстати, встречались на RCDL прошлой осенью в Ярославле. Я из СПбГУ, группа Б. Новикова.

    [info]iseg

    5 years ago

    [info]vnat

    5 years ago

    Anonymous

    September 22 2006, 14:36:24 UTC 5 years ago

    от bvd

    Рекомендую всем
    http://acl.ldc.upenn.edu/

    [info]iseg

    September 22 2006, 17:30:41 UTC 5 years ago

    Re: от bvd

    Борис, спасибо. Отличная ссылка. Я ее видел, но забыл про нее.

    [info]dsplace

    September 23 2006, 15:14:57 UTC 5 years ago

    А это яндексовская библиотека или чья-то личная? Если яндексовская (и на фото ее большая часть показана) - то какая-то маленькая и скромная :)

    Такой вопрос возник:
    Какие книжки (одну-две) и статьи (4-5, или может proceedings какой-то конференции было достаточно сильным) считаете best of the best по данной тематике? Временной период 2002-2006.

    [info]iseg

    September 24 2006, 15:42:45 UTC 5 years ago

    Скромная, конечно. Ведь сотни томов ir-мудрости (о которых я паче чаяния не знаю) в ней отсутствуют. :-)

    Вот я вас и спрашивал (чуть выше) - "чего в этом супе не хвататет".

    Ау?

    [info]dsplace

    September 25 2006, 11:25:45 UTC 5 years ago

    Насчет посоветовать чего может не хватать :)
    Т.к. я с IR знаком больше со стороны баз данных, то мне в целом нравится вот эта серия (в ней есть книги научного и технологического плана) книжек:
    "The Morgan Kaufmann Series in Data Management Systems"
    Сходу я не смог определить что в вашей библиотеке из этой серии, разве, что распознал Soumen Chakrabarti, ...
    Так или иначе, вот эта книжка из этой серии мне понравилась :)
    Data on the Web: From Relations to Semistructured Data and XML by Serge Abiteboul,Peter Buneman, and Dan Suciu

    Задачки для приема на работу
    William Poundstone; How Would You Move Mount Fuji? Microsoft's Cult of the Puzzle – How the World's Smartest Company Selects the Most Creative Thinkers
    John Mongan; Programming Interviews Exposed: Secrets to Landing Your Next Job

    How Would You Move Mount Fuji? я читал, а Programming Interviews Exposed: ... нет. Какая из них на ваш взгляд лучше? А в Яндексе при приеме на работу задают всякие головоломки (такого рода что описываются в How Would You Move Mount Fuji?) или предпочитают давать алгоритмические задачки?

    Cобственно поиск и веб-поиск
    ***; Information Retrieval
    ***; Modern Information Retrieval
    Karen Sparck Jones, et al; Readings in Information Retrieval
    Ian H. Witten, et al; Managing Gigabytes: Compressing and Indexing Documents and Images
    Michael W. Berry, Murray Browne; Understanding Search Engines : Mathematical Modeling and Text Retrieval
    Soumen Chakrabarti; Mining the Web: Analysis of Hypertext and Semi Structured Data
    Stefano Leonardi (ed); Algorithms and Models for the Web-Graph
    Gary Marchionini; Information Seeking in Electronic Environments
    C. J. van Rijsbergen; The Geometry of Information Retrieval
    David A. Grossman; Information Retrieval: Algorithms and Heuristics
    G. G. Chowdhury;Introduction to Modern Information Retrieval
    Charles T. Meadow;Text Information Retrieval Systems

    Какая из этих книжек (субъективно) вам больше всего нравится (самая полезная)?

    [info]iseg

    5 years ago

    [info]dsplace

    5 years ago

    [info]iseg

    5 years ago

    [info]lezy_ga

    1 year ago

    Deleted comment

    [info]iseg

    October 16 2006, 14:34:34 UTC 5 years ago

    скажите с кем связаться: мы им подарим.

    Anonymous

    October 18 2006, 14:53:17 UTC 5 years ago

    любому подарите? :)
    а есть ли у Вас что-то вроде Modern IR только в электронном виде - очень бы пригодился фундаментальный труд. Правда я в Киеве :(

    Deleted comment

    Anonymous

    October 30 2006, 10:09:25 UTC 5 years ago

    РГБ и ГПНТБ

    А ручками донести после этого в лом, барями стали. Так дайте мне, снесу.
    Create an Account
    Forgot your login or password?
    Facebook Twitter More login options
    English • Español • Deutsch • Русский…