Обойдемся без овертюры - локальная база лучше.

Если рассмотреть процесс создания дора, то можно выделить следующие этапы:

  • Создать дор
  • Залить его на хост
  • Поставить на дор ссылки

В общем все просто и понятно, если смотреть укрупненно. Знай себе - штампуй и штампуй.

Но, приступив к созданию дора, сталкиваешься с какой-то вроде мелочью, но которая отнимает уйму времени.

Взять процесс создания дора:
Что нужно, чтобы создать дор?

  • Киворды
  • Текст
  • дорген

С текстом вроде проблем нет, можно напарсить где угодно.

А вот мест для парсинга кеев не так много, да и процесс парсинга достаточно длителен с учетом небезотказности овертюры и подобных сервисов. Да и вообще, он-лайн сервисы - это все очень медленно.

Можно, конечно, обратиться за помощью к Максу Пастухову, он тут же пропишет нужное лекарство. Но оно не дешевое и не все могут его себе позволить.

Ну а куда деваться, все равно без кеев- никуда. Приходится мучить различные он-лайн сервисы. Не знаю кому как, но для меня это не самое интересное занятие.

В общем думал я, думал, как бы ускорить процесс сбора кеев, а меж тем парсил овертюру и складывал добычу в Keyword Organizer - собирал свою локальную базу поисковых запросов.

После того как узнал про базу AOL, процесс сбора кеев намного упростился, овертюра стала уже больше не нужна (во всяком случае пока не проверю базу AOL).

Скачал эту базу, распарсил, почистил от мусора и получил около 9 млн. запросов, размещенных в 10 файлах.

Осталось только написать программу, которая выбирала бы запросы, содержащие искомые слова, и локальная база готова.

Какое это счастье- набираешь кейворд и через 15 секунд получаешь несколько десятков тысяч запросов, а не тратишь на это полдня. :-)

Более 9 млн. запросов- для начала сойдет, этих кеев должно хватить надолго, а там посмотрим.

Программку я обозвал Key Selector. Линк отсюда убрал, свежая версия здесь. Базу выкладывать не буду, кому надо- скачает и распарсит сам.

Скрин:

выбиралка кеев
21 августа 2007, 10:15
Без темы
Спасибо за статейку и отдельное спасибо за програмку- очень даже полезные. Но у меня вопрос - что значит распарсить базу? и как ее почистить от мусора ? 20 лямов кеев - это не шутки шутить, не вручную же их просматривать и отбирать, и вообще по какому принципу определяется мусорность?

Anonymous =email=
21 августа 2007, 10:53
Без темы
Строки в исходной базе AOL состоят из групп символов (назовем их колонками), разделенных Tab. Распарсить - это значит сделать выборку нужной колонки (в данном случае колонки "Query" 2-я слева) по всем строкам баз.
Можно использовать какой-нибудь скрипт, я же распарсил Microsoft Access'ом.
Создаешь в Access'e новую базу данных, подключаешь к ней текстовые файлы базы AOL, создаешь SQL запрос выборки.
Получаешь 10 файлов с запросами.
Мусор отделить можно самим запросом, а можно использовать какой-нибудь текстовый редактор, например TextPipePro http://datamystic.com/ .

seng =email=
17 сентября 2007, 03:38
Без темы
а можно попродробней. каким образом можно распарсить базу в TextPipePro потмуо как скачал посмотрел но как пользываться так и не понял. вообще обычный эксель отлично справился бы с этой задачей. но там блин ограничение на 65к строк в файле

max =email=
17 сентября 2007, 13:09
Без темы
Напишу отдельным постом что-то типа мануала.

seng =email=

Адрес заметки: http://senglab.info/blog/post_1185305284.html


Обязательные для заполнения поля помечены карандашом.


Ваш комментарий к статье
cod

email при указании не будет опубликован.
Адреса с http:// преобразуются в ссылки автоматически.
Для этого отделяйте их от текста ПРОБЕЛАМИ с обеих концов.
Теги запрещены.
Page created in 0.17029 seconds Powered by LastoBlog