Основы работы в Internet

Страница: 23/24

Что такое ключевые слова и как с помощью них можно производить поиск нужной информации? Ключевые слова - это слова наиболее характерные для данного текста или интересующей вас тематики. Стандартные наборы ключевых слов составлены для широкого круга различных тематик и областей знаний: от психоанализа и физики элементарных частиц до плетения лаптей и корзин. Списки ключевых слов по стандартным тематикам обычно публикуются во всевозможных тезаурусах. См. например, [16]. Если данный документ не подходит ни к одной из стандартных тем, то поиск и выбор самих ключевых слов выливается в отдельную проблему; выбор слов - задача интеллектуальная, творческая. Например, для поиска сказок про Змея-Горыныча лучше всего использовать в качестве ключевого слова самого Змея-Горыныча, здесь все просто. А для поиска информации о трудных подростках - дезадаптоз. На самом деле труднее всего сужать поиск, а именно вводить все более характерные слова, т.к. выбранного одного слова обычно недостаточно, - слишком большой круг текстов оказывается охваченным. WAIS просто просматривает в указанных базах данных и архивах все тексты на предмет встречаемости ключевых слов и подсчитывает частоту встречаемости, после чего докладывает вам о результатах такого поиска - выдает список документов, в которых ключевые слова встречаются наиболее или достаточно часто, с указанием частот встречаемости. Вся же творческая часть работы по-прежнему лежит на вас. Человека в этом процессе подменить невозможно.

Глобальные гипертекстовые структуры: WWW

World Wide Web - ``Всемирная паутина''. (Короче: Web или W3)

Гипертекст - текст со вставленными в него словами (командами) разметки, ссылающимися на другие места этого текста, другие документы, картинки и т.д. Во время чтения такого текста (в соответствующей программе, его обрабатывающей и выполняющей соответствующие ссылки или действия) вы видите подсвеченные (выделенные) в тексте слова. Если наехать на них курсором и нажать клавишу или на кнопку (глаз) мышки, то высветится то, на что ссылалось это слово, например, другой параграф той же главы этого же текста. В WWW по ключевым словам можно попасть в совершенно другой текст из другого документа, войти в какую-нибудь программу, произвести какое-либо действие и т.д. В Internet в контексте WWW можно получать доступ к чему угодно, к telnet, e-mail, ftp, Gopher, WAIS, Archie, USENET News и т.п. В WWW можно ссылаться на данные на других машинах в любом месте сети, тогда при активации этой ссылки эти данные автоматически передадутся на исходную машину и вы увидите на экране текст, данные, картинку, а если провести в жизнь идею мультимедиа, то и звук услышите, музыку, речь. Это слегка напоминает Gopher, но фактически это принципиально другое и новое. В Gopher имеется жесткая структура меню, по который вы двигаетесь, как вам угодно. Эта структура не зависит от того, что вы делаете, какой документ пользуете и т.д. В WWW вы двигаетесь по документу, который может иметь какую угодно гипертекстовую структуру. Вы сами можете организовать структуры меню в гипертексте. Имея редактор гипертекстов, вы можете создать любую структуру рабочей среды, включая документацию, файлы, данные, картины, программное обеспечение и т.д., и это не будет новое программное обеспечение, а просто гипертекст. Увы, создание гипертекстовых редакторов с человеческим лицом (дружественным интерфейсом, отладчиком и т.д.) задача не из простых и еще не решенная.

Так как «читать» гипертекст приятнее (и вообще имеет смысл) в том случае, когда не возникает задержек при активации ссылок (подкачка текста с другого сервера или просто с сервера, но по местной сетевой линии, пересылка изображений, баз данных и т.д.), то WWW следует устанавливать на быстрые линии. На медленных линиях использование WWW превратится в сплошное мучение, ожидание, зависание, все прелести и сам смысл теряются. Также нерационально работать, например, по telnet в WWW на очень далеко расположенной машине, - это влетит вам в добрую копеечку. Именно поэтому хочется иметь такой сервер у себя в стране, хотя бы один.

WWW требует наличия по крайней мере доступа по вызову.

Этот способ структурирования информации и организации доступа к ней предложен и развит в CERN, об этом подробнее можно прочитать в [12]. Поработать в WWW можно по telnet на машине info.cern.ch. Трафик WWW составляет пока 0.31% от всего.

О других подходах к таким мультимедиа (использующим одновременно различные информационные среды) системам в сетях можно прочитать в [13],[14]. Последнее представляет номер журнала, посвященного полностью таким системам.

Несколько слов об иных возможностях

B (Berkley) BSD UNIX имеется класс R-команд (Remote). Это сетевые аналоги обычных команд UNIX. Их можно использовать для работы с удаленной машиной (rlogin, rcp и т.д.) вместо telnet, ftp и т.д.

В сети имеется служба времени, которая занимается синхронизацией и коррекцией часов по всей сети. Для этого используется специальные серверы и фоновые программы на сетевых машинах. В UNIX такая программа называется timed. Для связи и работы используется протокол ntp (network time protocol); он был специально разработан для синхронизации удаленных друг от друга машин.

Реферат опубликован: 30/10/2009