Что такое контекстный поиск
Перейти к содержимому

Что такое контекстный поиск

КОНТЕКСТНЫЙ ПОИСК

контекстный поиск — Метод последовательного поиска фрагментов текстовых записей путем их сравнения с заданной пользователем последовательностью символов. Для расширения искомых вариантов записей при контекстном поиске можно использовать так называемые универсальные… … Справочник технического переводчика

Мониторинг СМИ — Медиаведение Понятия Медиаданные • Медиасообщение • Медиатекст Массмедиа • Медиапространство Медиакомпетентность • Прозрачность медиа • Медиазависимость • Теория Холла Новые медиа • Альтернативные медиа • … Википедия

Проводник Windows — Сюда перенаправляется запрос «Оболочка Windows». На эту тему нужна отдельная статья. Проводник Windows … Википедия

TechnologiCS — Тип Программы PDM Разработчик СиСофт Девелопмент Операционная система Windows Языки интерфейса русский Последняя версия 6.2 (сборка 15917) (24 декабря 2012[1]) … Википедия

Текстовый редактор — Окно текстового редактора gedit Текстовый редактор  самостоятельная компьютерная программа или компонента программного комплекса (например, редактор исхо … Википедия

АК&M — Информационное Агентство АК М Тип ЗАО … Википедия

Linux Mint — Разработчик Clement Lefebvre и сообщество Семейство ОС Linux … Википедия

Текстовый редактор — программа для ввода и изменения текстовых данных: документов, книг, программ и т.д. Редактор обеспечивает модификацию строк текста, контекстный поиск и замену частей текста, автоматическую нумерацию страниц, обработку и нумерацию сносок,… … Финансовый словарь

Linux Standard Base — Linux Standard Base, LSB  совместный проект семейства операционных систем, основанных на Linux (т.е. дистрибутивов Linux), при организации Linux Foundation, целью которого является стандартизация их внутренней структуры. LSB опирается на… … Википедия

Вирус (компьютерный) — Компьютерный вирус разновидность компьютерных программ, отличительной особенностью которой является способность к размножению (саморепликация). В дополнение к этому вирусы могут повредить или полностью уничтожить все файлы и данные,… … Википедия

Проблема контекстного поиска информации в информационно-поисковой системе Текст научной статьи по специальности «Компьютерные и информационные науки»

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Максакова Л. С.

В данной статье рассматривается проблема контекстного поиска информации в ИПС. Рассмотрены основные информационные потребности пользователей, состояние разработок систем контекстного поиска, сферы использования современных ИПС, а так же говориться в каких случаях применяется контекстный поиск. В конце статьи подведены промежуточные итоги исследования.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Максакова Л. С.

Текст научной работы на тему «Проблема контекстного поиска информации в информационно-поисковой системе»

4. Maruster L., van Beest N.. Redesigning Business Processes: A Methodology Based on Simulation and Process Mining Techniques. Knowledge and Information Systems. — 2009.

5. Alves de Medeiros A.K., G'unther C.W. Process Mining: Using CPN Tools to Create Test Logs for Mining Algorithms // In K. Jensen, editor, Proceedings of the Sixth Workshop and Tutorial on Practical Use of Coloured Petri Nets and the CPN Tools. — 2005. — P. 177-190.

6. Ланцев Е.А. Агентный и дискретно-событийный подходы к имитационному моделированию бизнес-процессов в нотации eEPC // В мире научных открытий. — Красноярск, 2013. — С. 278-290.

7. J.C.A.M. Buijs. Mapping Data Sources to XES in a Generic Way. Master Thesis. — 2010. — P. 123.

8. De Medeiros A., van den Brand P., van der Aalst W., Weijters T., Gaaloul W., Pedrinaci C. Semantic Process Mining Tool — Final Implementation, Deliverable 6.11, Project IST 026850 SUPER (Sep 2008).

9. Alves de Medeiros A.K., Weijters A.J.M.M. and van der Aalst W.M.P. Data Mining and Knowledge Discovery. — 2007. — Vol. 14, Iss. 2. — P. 245-304.

ПРОБЛЕМА КОНТЕКСТНОГО ПОИСКА ИНФОРМАЦИИ В ИНФОРМАЦИОННО-ПОИСКОВОЙ СИСТЕМЕ

Московский государственный университет леса, г. Мытищи

В данной статье рассматривается проблема контекстного поиска информации в ИПС. Рассмотрены основные информационные потребности пользователей, состояние разработок систем контекстного поиска, сферы использования современных ИПС, а так же говориться в каких случаях применяется контекстный поиск. В конце статьи подведены промежуточные итоги исследования.

Информационно-поисковые системы появились на свет достаточно давно. Первые автоматизированные информационные системы начали разрабатываться еще в 50-х годах прошлого века, и главной их функцией был именно поиск информации. Поэтому их назвали информационно-поисковыми системами (ИПС). Информационно-поисковые системы (ИПС) появились в середине XX в., когда ученые предупредили о возможности возникновения проблемы информационного взрыва. Стало понятным, что контекстный поиск представляет отдельную задачу, имеющую свой предмет и свои методы решения. Но полностью автоматизировать интеллектуальные поисковые системы оказалось невозможным. В 70-е гг. с внедрением компьютеров в

* Магистрант кафедры Вычислительной техники.

работу библиотек началась автоматизация простых рутинных операций. Типичная ИПС тех лет — это человеко-машинная система, где анализ содержания документов и их индексирование выполнялись вручную, а компьютер использовался лишь для их поиска. Как правило, ИПС использовались в режиме избирательного распространения информации и функционировали как автономные системы. Далее, в конце 70-х гг.- середине 90-х гг. в развитии ИПС происходит переход от ручного интеллектуального индексирования к автоматизированному. Массовое распространение получили системы, названные бестезаурусными, или — системами поиска по свободному тексту free-text searching systems. Особенностью их является, с одной стороны, отказ от лексического контроля и тем самым отказ от учета парадигматики, с другой — широкое использование контекста и синтагматических связей.

Заключительный этап развития документальных ИПС начался с середины 1990-х гг. и длится по настоящее время.

Информационная потребность пользователя

Итак, в определенный момент времени у некоторого пользователя возникает информационная потребность в документах по той или иной нужной ему тематике, которая обычно достаточно узка.

В начальный момент эта потребность часто не может быть точно выражена словами. При этом любая поисковая система требует достаточно четких запросов.

Следовательно, пользователь должен представить свою информационную потребность в виде некоторого выражения, которое может быть воспринято поисковой системой.

Выделяют четыре этапа представления информационной потребности :

— реальная информационная потребность — это неосознанная истинная информационная потребность пользователя (потребность в некоторой новой информации при решении стоящей перед пользователем задачи);

— осознанная информационная потребность — появляется после осознания пользователем стоящей перед ним проблемы (осознанная потребность отличается от реальной, более того, пользователь может понимать имеющуюся проблему неправильно);

— выраженная информационная потребность — результат описания осознанной информационной потребности с помощью естественного языка;

— формализованная информационная потребность — это результат представления выраженной потребности средствами формального поискового языка ИПС.

Контекстный поиск применяется в следующих случаях:

— Пользователь затрудняется точно сформулировать запрос;

— Пользователь не точно помнит термины, которыми характеризуется интересующая его проблема;

— Пользователь хочет получить в результате поиска максимум документов (материалов), пусть даже отдалённо относящихся к интересующей его проблеме;

— Проблема не достаточно конкретна.

По результатам поиска система выстраивает найденные документы по степени их близости к контексту заданного пользователем запроса.

Каждому документу присваивается «вес». Документы с наибольшим «весом» имеют большую вероятность содержать полезную информацию и будут располагаться вверху списка. По мере движения вниз вес документов и соответственно вероятность содержания полезной информации убывает.

Состояние разработок систем контекстного поиска Системы контекстного поиска в последние годы стали активно использоваться в самых различных областях деятельности. В то время как первоначально они разрабатывались главным образом как инструмент для библиотечного дела, в настоящее время они нашли применение в различных организациях для работы с их текстовыми информационными ресурсами. Особенно интенсивно технологии контекстного поиска начали развиваться с появлением глобального информационного пространства Веб.

Расширение функциональные возможности

Разработчики систем контекстного поиска уделяют большое внимание не только совершенствованию механизмов выполнения их базовых функций, но и развитию ряда дополнительных возможностей, позволяющих существенным образом увеличить эффективность поиска, повысить управляемость системы, обеспечить более комфортные условия для работы пользователя. Перечислим некоторые такие возможности.

Повышение точности поиска. В формулировке пользовательского запроса не все термы могут быть равнозначными. Некоторые системы контекстного поиска позволяют пользователю придать веса используемым в запросе термам с тем, чтобы охарактеризовать их значимость в запросе. Эта информация используется при вычислении оценок релевантности документов информационным потребностям пользователя, и тем самым существенно повышается точность поиска.

Ранжирование результирующих документов запроса. В силу рассмотренных ранее причин системы контекстного поиска не могут гарантировать строгого удовлетворения информационных потребностей пользователя в результате выполнения поисковых запросов. Количество результирующих документов обычно бывает значительным. Поэтому очень важно упорядочить документы, выдаваемые системой пользователю, таким образом, чтобы в начале списка находились документы, которые, вероятно, в большей мере пред-

ставляют интерес для пользователя. Операция такого рода называется ранжированием документов. Развитые системы контекстного поиска обладают механизмами, обеспечивающими такую возможность. В зависимости от реализуемой ими модели поиска, предусматривается упорядочение множества документов, выдаваемых в результате обработки пользовательского запроса, по некоторым оценкам степени их релевантности запросу или вероятности удовлетворения информационных потребностей пользователя.

Обратная связь релевантности — важная функция, позволяющая повысить эффективность поиска требуемых пользователю документов. Дело в том, что результаты обработки запроса могут не удовлетворять пользователя. В таких случаях во многих системах текстового поиска пользователю предоставляется возможность уточнить запрос. Для этого он может дать оценку релевантности полученных документов — указать, какие из них он считает релевантными или нерелевантными.

Поскольку количество результирующих документов может быть довольно большим, пользователю предлагается оценить хотя бы несколько первых документов в ранжированном списке, т.е. тех документов, которым система назначила наивысшие оценки степени релевантности. Система может использовать термы этих документов для формирования нового, расширенного запроса, который, скорее всего, будет точнее выражать информационные потребности пользователя.

Такой итерационный процесс обработки запроса и модификации его с помощью анализа данных, полученных на основе обратной связи пользователя с системой, может повторяться до тех пор, пока пользователь не будет удовлетворен результатами поиска. Обратная связь релевантности используется в системах, основанных на различных моделях поиска.

Сферы использования современных ИПС

Современные ИПС характерны для так называемой информационной индустрии — новейшей области экономики и социальной сферы, занятой обработкой, систематизацией, накоплением и распространением информации. Бурное развитие ИПС связано с успехами информатики. Предметами запроса в ИПС могут быть библиографические данные, управленческая и фактографическая информация, экспертные оценки, ретроспективный опыт, результаты исследования моделей и т.д. Такой широкий круг задач обусловливает большое разнообразие типов ИПС. Они различаются своими целями, объемом содержащихся сведений, видами информации, способами доведения ее до потребителя. Наряду с локальными ИПС, действующими в рамках одного учреждения (библиотека или музей) существуют национальные и интернациональные центры информационного обслуживания. Широкое распространение получили библиографические ИПС (например, содержащие библиографию по всем областям научной литературы). Массовое производство персональных ЭВМ, развитие средств коммуникаций, возможность

объединения ЭВМ в информационные сети и обращения со своего рабочего места к сведениям, находящимся в памяти других ЭВМ, существенно расширили диапазон применения информации, широту и глубину ее поиска. Качественно новый этап развития ИПС связан с формированием баз данных на машиночитаемых носителях. Такие базы данных позволяют обращаться к ним дистанционно, одновременно по многим запросам, получая результаты поиска оперативно и в удобном виде.

Именно комплексный характер сведений послужил причиной разработки единой концепции ИПС. Она включает поэтапное создание отдельных подсистем, объединение которых достигается как на уровне обмена базами данных, так и с помощью средств коммуникаций.

В настоящее время проблематика поиска стала довольно обширной. Она охватывает различные области теории и разработки систем контекстного поиска, такие, как:

— развитие конкретных моделей поиска;

— методология проведения экспериментов, тестирования и оценки систем;

— методы реализации поиска;

— подходы к интеграции технологий текстового поиска и баз данных;

— методы сжатия данных;

— оценка эффективности обработки запросов;

— обработка естественного языка;

— методы классификации и кластеризации текстовых документов;

— приложения информационного поиска в электронных библиотеках;

— глубинный анализ текстов;

— технологии индексирования и поиска мультимедийной информации;

— интерфейсы «человек — компьютер» и т.д.

ОПТИМАЛЬНОЕ ПРОЕКТИРОВАНИЕ БИЗНЕС-ПРОЦЕССОВ НА ОСНОВЕ АППАРАТА ФУНКЦИОНАЛЬНЫХ СЕТЕЙ

© Сюняков С.А.*, Гриф М.Г.*

Новосибирский государственный технический университет, г. Новосибирск

Целью данной работы является рассмотрение и анализ принципов проектирования бизнес-процессов на основе аппарата функциональных сетей, описание процесса моделирования и создания классов для работ с ними.

* Магистрант кафедры Автоматизации систем управления.

* Заведущий кафедрой Автоматизации систем управления, доктор технических наук, профессор.

Что такое контекстный поиск

Кому нужен контекстный поиск?

Кому нужен контекстный поиск?

Системы бизнес-аналитики обеспечивают обработку больших объемов информации, однако вопрос поиска соответствующих данных и их выборки во многих случаях является сложной задачей, которая может быть решена путем применения технологии контекстного поиска.

Уже много лет люди успешно ищут нужную им информацию по ключевым словам в интернете. Для этого были разработаны специальные алгоритмы, многократно отточенные и доработанные компаниями, основным бизнесом которых является предоставление поисковых сервисов.

С технической точки зрения, любая база данных позволяет производить поиск по ключевым словам, открывая возможность интеллектуальной выборки информации для систем бизнес-аналитики. Однако на практике использование такого инструмента требует перестройки мировоззрения сотрудников компаний и креативного подхода к изменению критериев сбора важных для бизнеса данных.

Контекстный поиск для реальных задач

Хорошим примером использования данной технологии является компания "Еврохим", которая не только внедрила масштабную систему BI, но и реализовала на базе новых технологий реальные идеи по развитию и повышению гибкости бизнеса. Кроме представления витрин данных и консолидаторов, в рамках компании была внедрена концепция e-Corporation, обеспечивающая связность всех процессов в сети компании, а также предоставляющая инструменты свободного поиска всем пользователям системы.

Как отметил Владимир Чибисов, директор по развитию бизнес-систем МХК "Еврохим", холдинг смог погрузить реальных директоров по логистике, продажам, закупкам в среду электронной корпорации, дав им возможность моделировать новые бизнес-процессы, уйти от "бумажной" стадии их разработки, самим заняться бизнес-аналитикой. "Они, в свою очередь, сказали нам, что это оказалось полезнее, чем программы MBA. Все это реализовано на совершенно другом уровне, например отчеты как таковые становятся вообще неким пережитком", – отметил он.

По словам спикера, окупаемость системы была молниеносной, так как новые инструменты позволили принести в десятки раз больше прибыли по сравнению с затратами на внедрение. Впрочем, это стало возможным именно потому, что акцент в был сделан на обучении персонала и планомерной подготовке директоров к самостоятельной работе с инструментами BI.

Сценарии использования

Системы бизнес-аналитики могут использовать множество источников данных, охватывая десятки корпоративных информационных систем. Это позволяет аналитикам получать доступ к колоссальным массивам данных, структурированным определенным образом. Инструмент контекстного поиска позволяет избежать необходимости создания фиксированных форм отчетов и делать запросы по ключевым словам в тот момент, когда они нужны и актуальны.

Во-первых, используя систему контекстного поиска, аналитики могут оперативно выдать информацию на интересующий руководство вопрос, практически моментально сформировав определенный срез данных, полученных из различных источников. Такой способ использования технологии позволяет повысить время реакции на нестандартные вопросы и ускорить принятие решений в непредвиденных ситуациях.

Во-вторых, специалисты могут применять контекстный поиск для различных экспериментов, используя мощные инструменты на этапе разработки новой методологии анализа. Доступ к гибким средствам выборки по ключевым словам открывает креативные возможности для поиска новых вариантов анализа за пределами стандартных форм и отчетов.

В-третьих, контекстный поиск может применяться для уточнения и детализации полученных в результате подготовки отчетов данных. Точно так же как поиск в интернете позволяет найти дополнительные ссылки и ресурсы, контекстный поиск по хранилищам данных компании делает возможным моментальное погружение вглубь сложной ситуации или проблемы для ее детального изучения.

Наконец, поисковые машины могут использоваться не только аналитиками. По словам Сергея Борисова, директора департамента аналитических систем компании "Микротест", в последнее время эта технология все чаще находит применение в смежных с BI системах, предназначенных для очистки, нормализации, дедубликации справочных данных.

Реальная ситуация

В России на данном этапе технология не только не получила широкого применения, но даже не завоевала признания и понимания. Дело в том, что системы BI вообще появились в России поздно, не говоря уже о начале их зрелой эксплуатации. В связи с этим большинство отечественных компаний пока еще не испытывают потребности в решениях BI с возможностью свободного поиска данных в систематизированных хранилищах информации.

Специалисты "Астерос Консалтинг" признают, что в российских компаниях пока еще не работает идея "аналитического сервиса". И хотя система поиска позволяет получать данные из BI-системы без участия ИТ-специалистов, предоставляя пользователю доступ к большому объему корпоративной информации, описанной бизнес-терминами, она остается невостребованной. "Технология позволяет формировать отчеты произвольной формы по этим данным, используя контекстный поиск. Казалось бы, это очень удобно и эффективно.

Но в компаниях нашей страны очень распространена практика использования определенного набора отчетов с ограниченным перечнем данных. Функция контекстного поиска информации в этом случае остается невостребованной, ведь пользователь и так знает, где находится нужный ему отчет, – говорит Алексей Молчанов, эксперт направления BI-систем компании "Астерос Консалтинг". – Сотрудники отечественных компаний зачастую предпочитают привычные способы работы, неохотно принимая новые методы. И BI-системы не исключение. Например, недавно мы реализовали аналитический сервис для российского промышленного предприятия. Но клиент попросил создать также несколько стандартных форм отчетностей, которые сейчас активно использует. Аналитические сервисы оказались невостребованными".

В компании "Микротест", имеющей большой опыт внедрения систем BI, сообщают, что нестандартными функциями BI заказчики много интересуются, но в реальности редко используют их в повседневной работе, так как для этого нужно очень глубокое понимание методологии поиска штатными аналитиками компании.

Внедрение поиска по ключевым словам

Но даже если в системе BI данная возможность была заложена изначально, для того чтобы начать использовать систему контекстного поиска с пользой для бизнеса, необходимо тщательно подготовить для этого источники данных и специалистов, которые с ними работают. "Контекстный поиск – давно известная технология, которая, однако, до сих пор не получила широкого распространения. Причина столь медленного ее развития кроется главным образом в том, что применение этого вида поиска подразумевает наличие вполне структурированного набора источников и четкое понимание того, что нужно искать в базах. Это самостоятельный большой проект, в ходе которого данным в источниках присваиваются тэги или разрабатываются механизмы автоматического тэгирования, – говорит Олег Щербинин, руководитель направления аналитической отчетности и хранения данных компании "Ситроникс ИТ" в России. – В рамках такого проекта целесообразно рассматривать внедрение системы MDM для поддержки тэгов, что в итоге даст интересный бизнес-результат, например простой поиск всей связанной информации по контрагенту (договоры, договоры дочерних компаний, наши обязательства, финансовая отчетность по операциям с контрагентами)".

Компаниям, решившим использовать такие технологии, необходимо четко сформулировать критерии отбора информации, подключить максимальное количество важных для бизнеса источников данных к системам BI и провести обучение специалистов аналитического отдела, которое, кстати говоря, сможет выполнить далеко не каждый консультант.

Кому нужен контекстный поиск

Возможности контекстного поиска, главным образом, адресованы тем компаниям, которые ведут сложный и диверсифицированный бизнес, включают множество подразделений, а также сумели накопить большой объем данных за время работы на рынке. Когда поиск по созданному хранилищу данных становится сложным или затруднительным на базе стандартных форм и отчетов, в западных компаниях принимается решение использовать более гибкие средства для поиска нужной информации.

Как отмечает Ирина Терещенко, специалист по продажам решений по бизнес-аналитике, IBM в России и СНГ: "Контекстный поиск полезен в случае необходимости работы с огромным количеством данных, составлении разных типов отчетов, при большом штате сотрудников, работающих с системой. Контекстный поиск очень востребован среди аналитиков разных департаментов, ведь скорость их работы и эффективность зависит от скорости поиска информации и скорости доступа к ней. Чем быстрее аналитик находит нужную информацию, тем быстрее будет принято решение, например за рубежом аналитики активно используют контекстный поиск для того, чтобы руководители вовремя приняли важное управленческое решение".

По словам Олега Щербинина, технологии контекстного поиска будут востребованы крупными корпорациями, а также организациями, накопившими большие объемы исторических данных. Когда традиционные инструменты BI перестанут обеспечивать возможность поиска по неструктурированными массивам данных такого масштаба, российским компаниям придется использовать более гибкие средства аналитики, для которых необходима возможность свободного поиска и создания произвольных отчетов. Поэтому массовое применение поиска по ключевым словам – лишь вопрос времени.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *