Главная
Проект
Технологии
Контакты
Тезаурус
Блог на cnews
Семантический контент-анализ
Тематический анализ
Характеристический анализ

НОВОСТИ ПРОЕКТА

Четыре страницы результатов поиска, больше половины синтаксический мусор
Семантическое расстояние, семантический фильтр – атрибуты новой технологии информационного поиска (статья)
Семантический поиск: вопросы эффективности
Семантический фильтр. Исследование на три шага в глубину.
Семантический фильтр. Часть 1. Сравнение и оценка первых страниц синтаксических поисковых систем.
При нулевой синтаксической релевантности (вычисление семантического расстояния до текстов, не имеющих синтаксических совпадений)
Теперь Семантикус дает вербальную характеристику степени семантической близости
Количественная категориальная идентификации (вычисление семантического расстояния до текстов разных категорий)
Об инструменте Semanticus, базе знаний, моделях вычисления

Концепция семантического поиска информации Семантикус

Семантический поиск – нахождение документа наиболее близкого по смыслу к введенному пользователем запросу. Технологии, реализуемые в проекте Семантикус, предполагают определение семантического расстояния между фразой, выражающей мысль и множеством документов, найденных синтаксической поисковой системой.
Семантикус является тонким инструментом поиска, позволяющим максимально точно определять сложные смысловые запросы.

Этапы технологии семантического поиска Семантикус

Формулирование фразы выражающей необходимое смысловое содержание.


Важность этапа определяется тем, что мысль (смысловое содержание информационных потребностей) возникает в голове человека и не имеет материального выражения. Обмен мыслями происходит в знаковой форме, синтаксически. Знаковое выражение мысли вариативно и неоднозначно.Чем точнее будет знаковое описание смысла информационного запроса, тем более близкими по смыслу будут найденные документы.


К семантической поисковой системе не следует обращаться с простейшими запросами, выраженными в нескольких синтаксических единицах (словах запроса) или простыми фразами типа «Когда родился Пушкин».
Количество слов, которые потребуется записать для более точного выражения мысли может превышать 5-7 единиц. Именно с такими длинными (сложными) фразами следует обращаться к семантической поисковой системе. Подробнее.

Отправка фразы на вход синтаксической поисковой системы и получение множества ответов.

На втором этапе возможен простой или итеративный режим работы. Простой режим предполагает передачу фразы пользователя синтаксической поисковой системе без изменения и получение множества ответов.

Итеративный режим предполагает многократный процесс формирования множества запросов, оценивания ответов, формования новых запросов. Простой и итеративный режимы работы можно определить как ручной и автоматический. Или дешевый и дорогой. Подробнее…

Количественное определение семантической близости документов.

Ядро технологии Семантикус. Для каждого из найденных на втором этапе документов вычисляется оценка семантического расстояния Sp «до фразы» запроса. Оценка Sp – положительное вещественное число, определенное с точностью до нескольких знаков после запятой. Чем меньше значение Sp, тем ближе по смыслу найденный документ к фразе, сформулированной пользователем.

Пользователю предлагается измерительный инструмент (линейка), с помощью которого можно выбрать наиболее «семантически близкий» документ.

Аналитическая функция Семантикус: семантический фильтр.

Аналитическая функция предполагает просмотр и вычисление оценки Sp для большого числа документов, предложенных синтаксической поисковой системой.

Анализ документов завершается выдачей небольшого массива наиболее «семантически близких» материалов с оценками Sp. Таким образом, реализуется автоматизация поиска: пользователю не надо открывать и читать большой массив документов. Подробнее…