База данных
Home Up

 

Цены и Скидки
ГАРАНТИИ
База данных
Преподаватели
Нормоконтроль

На 25 марта 2001 года собственная база данных имеет размер 2 730 Мб (+126), в ней проиндексировано 18 353 (+761) документов! Размер индекса 144 Мб.

Когда мы начинали работу над созданием базы данных, то вначале внимательно изучили те ресурсы Интернета, которые были так или иначе связаны с поиском рефератов. 

При этом обнаружилась интересная закономерность: ВСЕ просмотренные нами сервера хранили рефераты в сжатом заархивированном виде (zip-архивы). Поиск нужных работ при этом велся только по названиям самих работ. Некоторые, самые крутые сервера осуществляли поиск работ еще по нескольким ключевым словам. В чем же недостаток такого метода хранения и поиска информации?

Предположим, вам нужна работа по истории на тему: "НЭП в России". На сервере в Интернете имеется дипломная работа на тему: "Россия в первой половине 20-го века". И в этой работе очень большое внимание уделяется именно НЭПу. Совершенно очевидно, что набрав в строке поиска тему работы "НЭП в России" вы никогда не найдете подходящую вам дипломную работу из которой можно было бы взять материал для вашей работы.

На нашем сервере все работы (рефераты, курсовые, дипломы) хранятся в незапакованном виде. Т. е. в виде файлов с форматами DOC, RTF, LEX, ASC, TXT. Весь текст в этих файлах проиндексирован (т. е. СУБД "знает" о каждом слове в каждом файле). И теперь если оператор базы данных набирает в поисковом запросе тему вашей работы "НЭП в России", то на экран выдаются ВСЕ файлы, в которых имеется хотя бы упоминание про НЭП. 

При таком подходе к делу от внимания оператора не ускользнет ни один файл, имеющий отношение к теме вашей работы. При этом оператор видит текст во всех найденных файлах (а не только одно его имя, как на серверах Интернета)! 

Еще один плюс такого метода поиска и хранения в следующем.

Предположим, что ваша работа собрана из кусков 5 работ. Если вам нужна еще одна работа на ту же тему и тому же преподавателю, то при повторном поиске оператор БД найдет не только уже выполненную работу, но и все работы, из которых бралась информация. В этом случае легко можно будет сверстать совершенно непохожую работу на ту же самую тему!

Несколько слов о методах пополнения базы данных.

Каждый день оператор БД производит поиск новейших работ на популярных серверах Интернета и закачивает их на наш сервер. При этом работы распаковываются, проверяются на отсутствие дубликатов среди уже имеющихся работ и заносятся в базу данных. Раз в месяц база данных индексируется.

По мере поступления на новороссийские рынки новых CD-дисков с рефератами их содержимое также распаковывается, проверяется на отсутствие дублей и заносится в базу данных.

 

 

Back Next

Hosted by uCoz