Category: общество

Category was added automatically. Read all entries about "общество".

Пожар в голове
  • xsbos

Помощь в составлении тестовой выборки

Здравствуйте. Мы в Институте Системного Программирования сейчас занимаемся задачей User Identity Resolution в применении к социальным сетям. Если кратко, то из двух данных социальных графов надо выделить пары профилей, принадлежащих одним и тем же людям. Мы тестируем наш подход на данных из Twitter и Facebook и в настоящий момент испытываем проблемы с составлением большой тестовой выборки, посему обращаемся с просьбой ко всем, кому не жалко 5 минут своего свободного времени, и у кого есть живые аккаунты в этих социальных сетях.

Для того, чтобы помочь нам, отправьте, пожалуйста, в удобной вам форме на почту следующую информацию:

1. URL'ы ваших профилей в Twitter и Facebook соответственно.
2. Список профилей ваших друзей в Twitter и Facebook, которые принадлежат одному человеку (в чем вы лично уверены). (необязательно, если вы считаете это недопустимым)

Мы обещаем, что все данные будут анонимизированы, никому кроме нас в руки не попадут, будут использоваться только в рамках данного исследования и т.д. Также заверяем всех, что мы не КГБ и не работаем на КГБ-подобные организации, мы просто проводим исследование (основной юзкейс, если уж на то пошло, подробно описан в комментариях). Будем благодарны за перепост где-либо и/или подсказку, где еще имеет смысл написать.

Заранее спасибо.

defolt
  • rusl

Удаление из вектора признаков малозначимых термов.

Одним из способов сокращения размерности пространства признаков является удаление неинформативных, для задачи классификации, слов. Это помогает улучшить качество классификации и снизить время работы алгоритма. Collapse )