Меня просили показать библиотеку Яндекса с книжками по IR. Часть книг - на руках (процентов 15-20), но кое-что стоит на полке. Таки чего "в этом супе" не хватает по вашему мнению?
может быть еще и с аннотациями? :-) (на вопросы про конкретные книги могу дать ответ)
Преамбула: список неполон, части русских книг нет.
Cобственно поиск и веб-поиск
***; Information Retrieval
***; Modern Information Retrieval
Karen Sparck Jones, et al; Readings in Information Retrieval
Ian H. Witten, et al; Managing Gigabytes: Compressing and Indexing Documents and Images
Michael W. Berry, Murray Browne; Understanding Search Engines : Mathematical Modeling and Text Retrieval
Soumen Chakrabarti; Mining the Web: Analysis of Hypertext and Semi Structured Data
Stefano Leonardi (ed); Algorithms and Models for the Web-Graph
Gary Marchionini; Information Seeking in Electronic Environments
C. J. van Rijsbergen; The Geometry of Information Retrieval
David A. Grossman; Information Retrieval: Algorithms and Heuristics
G. G. Chowdhury;Introduction to Modern Information Retrieval
Charles T. Meadow;Text Information Retrieval Systems
обработка естественного языка
Christopher D. Manning, Hinrich Schutze; Foundations of Statistical Natural Language Processing
Daniel Jurafsky; Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition
Tomek Strzalkowski; Natural Language Information Retrieval
Peter Jackson; Natural Language Processing for Online Applications: Text Retrieval, Extraction, and Categorization
Аннотирование, кластеризация в информационном поиске
Inderjeet Mani, Mark T. Maybury; Advances in Automatic Text Summarization
Marie-Francine Moens; Automatic Indexing and Abstracting of Document Texts
James Allan (ed.); Topic Detection and Tracking
Weili Wu; Clustering and Information Retrieval
Машинное обучение (классификация, Data-mining, искусственный интеллект)
Stuart J. Russell; Artificial Intelligence: A Modern Approach
Ethem Alpaydin; Introduction to Machine Learning (Adaptive Computation and Machine Learning)
Ian H. Witten; Data Mining: Practical Machine Learning Tools and Techniques
Dorian Pyle; Data Preparation for Data Mining
Поиск и классификация изображений по содержанию
Vittorio Castelli; Image Databases : Search and Retrieval of Digital Imagery
Corinne Jorgensen; Image Retrieval: Theory and Research
Алгоритмы работы со строками
Dan Gusfield; Algorithms on Strings, Trees, and Sequences: Computer Science and Computational Biology
Дэн Гасфилд; Строки, деревья и последовательности в алгоритмах. Информатика и вычислительная биология
Gonzalo Navarro; Flexible Pattern Matching in Strings
Christian Charras; Handbook of Exact String Matching Algorithms
Maxime Crochemore; Jewels of Stringology Попов Дмитрий
Социальные сети
Stanley Wasserman. Social Network Analysis : Methods and Applications
John P Scott. Social Network Analysis: A Handbook
Прочие алгоритмы, трюки, полезности
Robert Sedgewick; Algorithms in C++
***; Алгоритмические трюки для программистов
***; Графы в программировании: обработка, визуализация и применение
Д. Бентли; Жемчужины программирования (2-е изд)
Д. Бентли; Жемчужины творчества программистов (1-е изд)
***; Основы многопоточного, параллельного и распределенного программирования
***; Практика программирования
К. Касперский; Техника оптимизации программ. Эффективное использование памяти
Задачки для приема на работу
William Poundstone; How Would You Move Mount Fuji? Microsoft's Cult of the Puzzle – How the World's Smartest Company Selects the Most Creative Thinkers
John Mongan; Programming Interviews Exposed: Secrets to Landing Your Next Job
i18n и лингвистка
***; The Unicode Standard, version 2.0
Зализняк А.А.; Грамматический словарь русского языка
Ruslan Mitkov; The Oxford Handbook of Computational Linguistics
трудов SIGIR (вроде ведь не все доступно в ACM DL?) Information Processing & Management (содержание можно посмотреть тут - http://www.sciencedirect.com/science/journal/03064573)
Не хватает практически всего * Подписки на ведущие журналы, в частности на журналы ACM (хотя бы в электронном виде) * Трудов конференций, в частности SIGIR и VLDB (хотя бы в электронном виде) * Свободного времени, чтобы это читать и проверять на практике * Очень мало книжек по поиску изображений
1 и 2 есть в подписке на acm dl (для россии примерно 40 долларов в год вместе с членством в acm и редиректящим e-mail-ом itman@acm.org. смешно, правда?) 3 - согласен 4 - каких?
То есть ты хочешь сказать, что разработчик должен заплатить 40 долларов из своей зарплаты за членство в ACM и еще по 50 за пару других журналов? Знаешь как это называется?
К книгам по поиску изображений по содержанию добавила бы книги по обработке оных. Невозможно разрабатывать алгоритмы CBIR, не зная что и как можно делать с содержанием картинок.
У меня есть две любимых книги в этой области, считай библии:
Digital Image Processing, R. Gonzalez, R.Woods - в 2002 вышло второе издание, а в 2005 - издали на русском языке, изд. Техносфера. Перевод вполне пристойный.
Digital Image Processing, Kenneth R.Castleman, 1995 - немного фундаментальнее первой, больше математики.
Да, я занимаюсь CBIR. Как говорится, "я не волшебник, я еще только учусь", но надеюсь что когда-нибудь все-таки защищу кандидатскую на основе своих исследований. И исследования на этом не закончатся :)
Мы, кстати, встречались на RCDL прошлой осенью в Ярославле. Я из СПбГУ, группа Б. Новикова.
А это яндексовская библиотека или чья-то личная? Если яндексовская (и на фото ее большая часть показана) - то какая-то маленькая и скромная :)
Такой вопрос возник: Какие книжки (одну-две) и статьи (4-5, или может proceedings какой-то конференции было достаточно сильным) считаете best of the best по данной тематике? Временной период 2002-2006.
Насчет посоветовать чего может не хватать :) Т.к. я с IR знаком больше со стороны баз данных, то мне в целом нравится вот эта серия (в ней есть книги научного и технологического плана) книжек: "The Morgan Kaufmann Series in Data Management Systems" Сходу я не смог определить что в вашей библиотеке из этой серии, разве, что распознал Soumen Chakrabarti, ... Так или иначе, вот эта книжка из этой серии мне понравилась :) Data on the Web: From Relations to Semistructured Data and XML by Serge Abiteboul,Peter Buneman, and Dan Suciu
Задачки для приема на работу William Poundstone; How Would You Move Mount Fuji? Microsoft's Cult of the Puzzle – How the World's Smartest Company Selects the Most Creative Thinkers John Mongan; Programming Interviews Exposed: Secrets to Landing Your Next Job How Would You Move Mount Fuji? я читал, а Programming Interviews Exposed: ... нет. Какая из них на ваш взгляд лучше? А в Яндексе при приеме на работу задают всякие головоломки (такого рода что описываются в How Would You Move Mount Fuji?) или предпочитают давать алгоритмические задачки?
Cобственно поиск и веб-поиск ***; Information Retrieval ***; Modern Information Retrieval Karen Sparck Jones, et al; Readings in Information Retrieval Ian H. Witten, et al; Managing Gigabytes: Compressing and Indexing Documents and Images Michael W. Berry, Murray Browne; Understanding Search Engines : Mathematical Modeling and Text Retrieval Soumen Chakrabarti; Mining the Web: Analysis of Hypertext and Semi Structured Data Stefano Leonardi (ed); Algorithms and Models for the Web-Graph Gary Marchionini; Information Seeking in Electronic Environments C. J. van Rijsbergen; The Geometry of Information Retrieval David A. Grossman; Information Retrieval: Algorithms and Heuristics G. G. Chowdhury;Introduction to Modern Information Retrieval Charles T. Meadow;Text Information Retrieval Systems Какая из этих книжек (субъективно) вам больше всего нравится (самая полезная)?
September 21 2006, 10:27:39 UTC 5 years ago
Можно ли списком с названиями и авторами?
September 21 2006, 10:43:44 UTC 5 years ago
Преамбула: список неполон, части русских книг нет.
Cобственно поиск и веб-поиск
обработка естественного языка
Аннотирование, кластеризация в информационном поиске
Машинное обучение (классификация, Data-mining, искусственный интеллект)
Поиск и классификация изображений по содержанию
Алгоритмы работы со строками
Социальные сети
Прочие алгоритмы, трюки, полезности
Задачки для приема на работу
i18n и лингвистка
September 21 2006, 10:33:08 UTC 5 years ago
September 21 2006, 10:44:22 UTC 5 years ago
September 21 2006, 10:34:20 UTC 5 years ago
September 21 2006, 10:44:32 UTC 5 years ago
Anonymous
September 21 2006, 18:56:33 UTC 5 years ago
как насчет ...
трудов SIGIR (вроде ведь не все доступно в ACM DL?)Information Processing & Management (содержание можно посмотреть тут - http://www.sciencedirect.com/science/jou
September 22 2006, 07:08:08 UTC 5 years ago
Re: как насчет ...
доступны конечноSeptember 22 2006, 07:08:57 UTC 5 years ago
Re: как насчет ...
ipm и jassist - оба дорогие и в dl не входят, это правда.September 22 2006, 06:52:17 UTC 5 years ago
* Подписки на ведущие журналы, в частности на журналы ACM (хотя бы в электронном виде)
* Трудов конференций, в частности SIGIR и VLDB (хотя бы в электронном виде)
* Свободного времени, чтобы это читать и проверять на практике
* Очень мало книжек по поиску изображений
September 22 2006, 07:07:43 UTC 5 years ago
3 - согласен
4 - каких?
September 22 2006, 07:13:12 UTC 5 years ago
5 years ago
5 years ago
5 years ago
5 years ago
5 years ago
Anonymous
5 years ago
5 years ago
5 years ago
5 years ago
5 years ago
September 22 2006, 08:34:15 UTC 5 years ago
У меня есть две любимых книги в этой области, считай библии:
Digital Image Processing, R. Gonzalez, R.Woods - в 2002 вышло второе издание, а в 2005 - издали на русском языке, изд. Техносфера. Перевод вполне пристойный.
Digital Image Processing, Kenneth R.Castleman, 1995 - немного фундаментальнее первой, больше математики.
В принципе, наверно достаточно одной из них.
September 22 2006, 09:46:14 UTC 5 years ago
(а вы заняты cbir?)
September 23 2006, 07:40:21 UTC 5 years ago
Да, я занимаюсь CBIR. Как говорится, "я не волшебник, я еще только учусь", но надеюсь что когда-нибудь все-таки защищу кандидатскую на основе своих исследований. И исследования на этом не закончатся :)
Мы, кстати, встречались на RCDL прошлой осенью в Ярославле. Я из СПбГУ, группа Б. Новикова.
5 years ago
5 years ago
Anonymous
September 22 2006, 14:36:24 UTC 5 years ago
от bvd
Рекомендую всемhttp://acl.ldc.upenn.edu/
September 22 2006, 17:30:41 UTC 5 years ago
Re: от bvd
Борис, спасибо. Отличная ссылка. Я ее видел, но забыл про нее.September 23 2006, 15:14:57 UTC 5 years ago
Такой вопрос возник:
Какие книжки (одну-две) и статьи (4-5, или может proceedings какой-то конференции было достаточно сильным) считаете best of the best по данной тематике? Временной период 2002-2006.
September 24 2006, 15:42:45 UTC 5 years ago
Вот я вас и спрашивал (чуть выше) - "чего в этом супе не хвататет".
Ау?
September 25 2006, 11:25:45 UTC 5 years ago
Т.к. я с IR знаком больше со стороны баз данных, то мне в целом нравится вот эта серия (в ней есть книги научного и технологического плана) книжек:
"The Morgan Kaufmann Series in Data Management Systems"
Сходу я не смог определить что в вашей библиотеке из этой серии, разве, что распознал Soumen Chakrabarti, ...
Так или иначе, вот эта книжка из этой серии мне понравилась :)
Data on the Web: From Relations to Semistructured Data and XML by Serge Abiteboul,Peter Buneman, and Dan Suciu
Задачки для приема на работу
William Poundstone; How Would You Move Mount Fuji? Microsoft's Cult of the Puzzle – How the World's Smartest Company Selects the Most Creative Thinkers
John Mongan; Programming Interviews Exposed: Secrets to Landing Your Next Job
How Would You Move Mount Fuji? я читал, а Programming Interviews Exposed: ... нет. Какая из них на ваш взгляд лучше? А в Яндексе при приеме на работу задают всякие головоломки (такого рода что описываются в How Would You Move Mount Fuji?) или предпочитают давать алгоритмические задачки?
Cобственно поиск и веб-поиск
***; Information Retrieval
***; Modern Information Retrieval
Karen Sparck Jones, et al; Readings in Information Retrieval
Ian H. Witten, et al; Managing Gigabytes: Compressing and Indexing Documents and Images
Michael W. Berry, Murray Browne; Understanding Search Engines : Mathematical Modeling and Text Retrieval
Soumen Chakrabarti; Mining the Web: Analysis of Hypertext and Semi Structured Data
Stefano Leonardi (ed); Algorithms and Models for the Web-Graph
Gary Marchionini; Information Seeking in Electronic Environments
C. J. van Rijsbergen; The Geometry of Information Retrieval
David A. Grossman; Information Retrieval: Algorithms and Heuristics
G. G. Chowdhury;Introduction to Modern Information Retrieval
Charles T. Meadow;Text Information Retrieval Systems
Какая из этих книжек (субъективно) вам больше всего нравится (самая полезная)?
5 years ago
5 years ago
5 years ago
1 year ago
Deleted comment
October 16 2006, 14:34:34 UTC 5 years ago
Anonymous
October 18 2006, 14:53:17 UTC 5 years ago
а есть ли у Вас что-то вроде Modern IR только в электронном виде - очень бы пригодился фундаментальный труд. Правда я в Киеве :(
Deleted comment
Anonymous
October 30 2006, 10:09:25 UTC 5 years ago
РГБ и ГПНТБ
А ручками донести после этого в лом, барями стали. Так дайте мне, снесу.