Monday, June 22, 2009

Послуги Інтернет автоматизованого пошуку інфо

Сучасний рівень розвитку апаратних та програмних засобів зробив можливим широке застосування баз даних оперативної інформації на всіх рівнях управління. Широке впровадження персональних комп’ютерів в інформаційні системи різноманітного призначення забезпечує підґрунтя для створення в Україні єдиного інформаційного простору господарської, економічної та політичної діяльності держави. Приоритетним стає питання отримання якісної, достовірної та своєчасної інформації.
Більшість досліджень в цієї галузі присвячено адаптивним пошуковим засобам, які дозволяють користувачеві отримувати найбільш прийнятні та корисні саме для нього матеріали.
Адаптивна фільтрація інформації – класична технологія з області інформаційного пошуку. Її мета – знайти декілька елементів, що відповідають інтересам користувача, у великому об’ємі документів. У Інтернет ця технологія використовується як у пошуковому контексті, так і в контексті перегляду. Вона може бути застосована для пристосування результатів веб-пошуку, із використанням фільтрації і впорядкування і для вироблення рекомендацій щодо найбільш відповідних документів серед отриманого набору, використовуючи генерацію посилань.
Існує два принципово різних типи механізмів, які можуть розглядатися, як дві різні технології – фільтрація на основі вмісту і сумісна фільтрація. Перша спирається на вміст документа, тоді як остання абсолютно ігнорує вміст, намагаючись замість цього підібрати користувачів, які будуть зацікавлені в однакових документах. У цьому випадку пошук проводиться в два етапи: пошук і формування тематичних колекцій та відбір відповідної колекції (або кластера) на підставі метаопису користувача
До систем автоматизованого пошуку інформації в мережі Internet належать такі системи.
• Gopher - найпоширеніший засіб пошуку інформації в мережі Internet, що дозволяє знаходити інформацію по ключовим словам і фразам. Робота із системою Gopher нагадує перегляд змісту, при цьому користувачу пропонується пройти крізь ряд вкладених меню і вибрати потрібну тему. У Internet у даний час понад 2000 Gopher-системи, частина з яких є вузькоспеціалізованими, a частина містить більш різнобічну інформацію. Gopher дозволяє одержати інформацію без вказівки імен і адрес авторів, завдяки чому користувач не витрачає багато часу і нервів. Він просто повідомить системі Gopher, що саме йому потрібно, і система знаходить відповідні дані. Gopher-серверів понад двох тисячі, тому за їхньою допомогою не завжди просто знайти необхідну інформацію. У випадку виниклих утруднень можна скористатися службою VERONICA. VERONICA здійснює пошук більш ніж у 500 системах Gopher, звільнюючи користувача від необхідності переглядати їх вручну.
• WAIS - ще більш потужний засіб одержання інформації, чим Gopher, оскільки воно здійснює пошук ключових слів у всіх текстах документів. Запити посилаються в WAIS на спрощеній англійській мові. Це значно легше, ніж формулювати їх на мові алгебри логіки, і це робить WAIS більш привабливою для користувачів-непрофессіоналів. При роботі з WAIS користувачам не потрібно витрачати багато часу, щоб знайти необхідні їм матеріали. У мережі Internet існує більш 200 WAIS - бібліотек. Але оскільки інформація рекомендується переважно співробітниками академічних організацій на добровільних початках, велика частина матеріалів відноситься до області досліджень і комп'ютерних наук.
• WWW - система для роботи з гіпертекстом. Потенційно вона є найбільш потужним засобом пошуку. Гипертекст з'єднує різноманітні документи на основі заздалегідь заданого набору слів. Наприклад, коли в тексті зустрічається нове слово або поняття, система, що працює з гипертекстом, дає можливість перейти до іншого документу, у котрому це слово або поняття розглядається більш докладно. WWW часто використовується в якості інтерфейсу до баз даних WAIS, але відсутність гіпертекстових зв'язків обмежує можливості WWW до простого перегляду, як o Gopher. Користувач із своєї сторони може задіяти можливість WWW працювати з гіпертекстом для зв'язку між своїми даними і даними WAIS і WWW таким чином, щоб власні записи користувача як би інтегрувалися в інформацію для загального доступу. Насправді цього, звичайно, не відбувається, але сприймається саме так.
Практично всі послуги мережі побудовані на принципі клієнт-сервер. Сервером у мережі Internet називається комп'ютер спроможний надавати клієнтам (у міру приходу від них запитів) деякі мережні послуги. Взаємодія клієнт-сервер будується звичайно в такий спосіб. По приході запитів від клієнтів сервер запускає різноманітні програми надання мережних послуг. В міру виконання запущених програм сервер відповідає на запити клієнтів. Все програмне забезпечення мережі також можна поділити на клієнтське і серверне. При цьому програмне забезпечення серверу займається наданням мережних послуг, a клієнтське програмне забезпечення забезпечує передачу запитів серверу й одержання відповідей від нього.
Пошукові системи поділяються на тематичні (класифікатори) та індексні системи пошуку.
Тематичні системи пропонують користувачам список категорій, в якому Web-сторінки впорядковуються за ієрархічною схемою. Переміщуючись по дереву каталогів, можна послідовно обмежити область пошуку й у результаті отримати список посилань на WEB-вузли, що пов'язані з потрібною темою. Для використання класифікаторів щодо пошуку інформації необхідно точно знати, до якої категорії належить ця інформація. Крім того, необхідно мати на увазі, що класифікація ресурсів виконується людиною і тому може бути суб'єктивною. До тематичних пошукових систем належать: www.mckinley.com, www.yahoo.com, www.list.ru та інші.
Індексні системи виконують пошук сторінок, що містять задані ключові слова. По закінченні пошуку система виводить список сайтів, які задовольняють заданим критеріям. Критерієм може бути слово, набір слів або логічний вираз.
Методи індексування поділяють на статистичні, теоретико-інформаційні та ймовірні.
До індексних пошукових систем відносяться: www.excite.com, www.altavista.com, www.infoseek.com, www.lycos.com, www.rambler.ru, www.yandex.ru, www.search.avanport.com.
Останнім часом більшість пошукових систем поєднують в собі можливості як класифікаторів, так і індексів.

No comments:

Post a Comment