Обучающие данные Обучающие данные




НазваниеОбучающие данные Обучающие данные
Дата конвертации30.01.2013
Размер445 b.
ТипКонкурс



Обучающие данные

  • Обучающие данные

  • Набор запросов q(i)

  • Набор документов dj(i) для каждого запроса q(i)

  • Rel(q(i), dj(i)) - ручная оценка соответствия документа запросу

  • Конкурс «Интернет-математика – 2009»:

  • Rel(q, d) - значения из диапазона [0, 4]

  • (4 – «высокая релевантность»,…, 0 – «нерелевантно»)



Набор факторов ранжирования

  • Набор факторов ранжирования

  • F = (f1(q,d) , …, fN(q,d))

  • Конкурс «Интернет-математика – 2009»:

  • N=245

  • «Яндекс на РОМИП’2009»:

  • N=163

  • (коллекция BY.WEB);

  • N=69

  • (коллекция KM.RU, без ссылочных факторов)



Запросные

  • Запросные

  • длина документа в словах;

  • язык запроса.

  • Текстовые

  • наличие точного вхождения запроса в тексте документа;

  • наличие точного вхождения запроса в заголовке документа;

  • tf*idf;

  • различные модификации формулы Okapi_BM25.



Ссылочные

  • Ссылочные

  • PageRank;

  • логарифм количества ссылок на документ;

  • процент ссылок на документ, содержащих точное вхождение запроса.

  • Географические

  • регион сайта;

  • язык документа.



Числовое соответствие документа запросу

  • Числовое соответствие документа запросу

  • Fr(q, d) = Fr(F(q,d)) = Fr(f1(q,d), …, fN(q,d))

  • Построение функции релевантности с помощью генетических алгоритмов:

  • 1. Выбор метрики

  • («Яндекс на РОМИП’2009»: pfound – максимизация вероятности найти релевантный результат)

  • 2. Подбор вида функции

  • («Яндекс на РОМИП’2009»: полином ∑aIf1i1 f2i2… fNiN )

  • 3. Подбор коэффициентов



Обучающие данные

  • Обучающие данные

  • (q(i), dj(i)),

  • i=1,…,n;

  • j=1,…m(n).



Отдельные функции релевантности:

  • Отдельные функции релевантности:

  • 19 городов России: Москва, Санкт-Петербург, Екатеринбург, Новосибирск и др.

  • Общероссийская

  • Украина

  • Белоруссия

  • Казахстан

  • Отличаться могут не только коэффициенты, но и сам вид функций!



Постановка эксперимента

  • Постановка эксперимента

  • Выбор исследуемого фактора

  • Генерация тестовых коллекций

  • Варьирование исследуемого фактора

  • Фиксация остальных факторов

  • Индексация тестовых коллекций

  • Анализ результатов

  • Принятие решения о характере влияния исследуемого фактора на функцию релевантности



Фактор: Количество употреблений термина запроса (tf)

  • Фактор: Количество употреблений термина запроса (tf)

  • Характер зависимости: Прямая

  • Фактор: Длина документа в словах

  • Характер зависимости: Обратная

  • Фактор: Количество употреблений самого частотного термина

  • Характер зависимости: Обратная





Похожие:

Обучающие данные Обучающие данные iconУрока Цели урока Первый тур игры Второй тур игры Третий тур игры Обучающие: Обучающие
Обобщить и систематизировать знания об истории и культуре Передней Азии в древности; устранить пробелы в знаниях, углубить знания...
Обучающие данные Обучающие данные iconОбучающие задачи программы: Обучающие задачи программы
Основа данного метода решение какой-либо проблемы при использовании самых разнообразных информационных средств. Автор проекта работает...
Обучающие данные Обучающие данные iconОбучающие: Определить основные черты развития США в период с 1945 по 2008г. Обучающие: Определить основные черты развития США в период с 1945 по 2008г
Развивающие: Способствовать развитию критического мышления у учащихся, формировать умения и навыки работы с учебником, выяснения...
Обучающие данные Обучающие данные iconРадиолокационные данные, получены следующим путем: Радиолокационные данные, получены следующим путем
Конечные данные могут быть использованы в производстве радиолокационных изображений
Обучающие данные Обучающие данные iconИсходные данные Исходные данные
Многоисточниковые лекарственные средства являются взаимозаменяемыми с препаратами известных торговых марок
Обучающие данные Обучающие данные icon1. Анкетные данные Анкетные данные
Участие в семинарах, «Круглых столах»,педагогических советах, конференциях, конкурсах профессионального мастерства
Обучающие данные Обучающие данные iconПримерная программа общеобразовательной дисциплины информатика и икт для нпо и спо модели реализации 2009 Обучающие (предметные зун) Обучающие (предметные зун)
Примерная программа общеобразовательной дисциплины информатика и икт для нпо и спо
Обучающие данные Обучающие данные iconПрограмма, включающая обучающие визиты в Польшу для студентов, молодых специалистов и профессионалов из стран Восточной Европы

Обучающие данные Обучающие данные iconЭкспериментальные данные и аналоговые сигналы Экспериментальные данные и аналоговые сигналы
Разложение обратимо, т е по коэффициентам разложения можно точно восстановить исходный дискретный сигнал
Обучающие данные Обучающие данные iconОбучающие
Познакомить учащихся с возможностями электронной таблицы excel при создании элементов деловой графики диаграмм и графиков
Разместите кнопку на своём сайте:
hnu.docdat.com


База данных защищена авторским правом ©hnu.docdat.com 2012
обратиться к администрации
hnu.docdat.com
Главная страница