Лень и ее последствия

Занимался созданием сплогов на базе скрипта портатора от Ласто. Запустил этот скрипт на несколько доменов. Суть работы скрипта заключается в импорте новостей со статейных ресурсов, синонимизации и публикации на сплоге. Со скриптом идет база синонимов.

Сплоги делались русскоязычные в основном под сапу. Я сильно не затачивал скрипт, вся установка сводилась к редактированию конфига и заливке на хост. Основная задача заключалась в том, чтобы загнать в яндекс как можно больше страниц. Базу синонимов я тоже оставил дефолтовую, она небольшая- около 3 тыс. строк. Понадеялся так сказать на авось. Ну и еще мне тогда показалось, что 3000 синонимов – пока достаточно. Да что лукавить, просто поленился собрать свою базу, мол и так сойдет, мне же главное индексация.

Запустил я значит эти сплоги и стал ждать, пока они наполнятся контентом. Ну а как только набирался десяток статей, говорил яндексу, что надо бы проиндексировать этот замечательный сайт с «уникальным контентом». Яндекс засылал бота, тот делал 1 хит и уходил. Иногда возвращался и кушал еще немного страниц и ставил их в индекс, но чаще- не возвращался.

Те сайты, которые сразу не поставил в индекс, не получилось загнать и проставлением покупных ссылок и регистрацией по каталогам. Мало того даже проиндексированные ранее сайты яша стал выкидывать из индекса. Правда на некоторых были продажные ссылки, может и из-за этого конечно.

Поэтому я решил для чистоты эксперимента сделать еще несколько сайтов, но в этот раз никаких продажных ссылок, и почти никаких внешних ссылок, за исключением ссылок на источники. Зарегил еще 10 доменов в зоне ru, все на разные хуисы, поселил их на российском хостинге. Как только набиралось 15-20 статей добавлял в яндекс блоги. При этом каждый раз чистил куки, менял айпишник.

Из десяти доменов еле пролезли в индекс только три. Через неделю часть проиндексированных страниц этих трех доменов благополучно покинула яндекс. Т.е. яндекса не стошнило (во всяком случае пока) только от трех сайтов из представленных ему десяти. Видимо в остальных что-то не понравилось. А что ему могло не понравиться? Продажных ссылок не было, дизайн на всех одинаковый, видимо дело все-таки в контенте. «Но ведь контент на них уникализированный, не копи-паст»- так я подумал, позабыв о том, что базу синонимов я оставил ту, что шла со скриптом, и я даже ни разу не сравнил статью на доноре со статьями на моих сайтах. Оставил я пока эти сайты под наблюдением, точнее вообще о них забыл на некоторое время.

Но вот как-то поздно ночью, запустив свой любимый rss- ридер и читая разные блоги, наткнулся на неведомую мне ранее программу для сравнения двух текстов Shingles Expert. Заинтересовала, решил проверить ее в действии. Стал думать на чем бы ее испытать и тут вспомнил о своих сплогах.

Проверил, оказалось что сходство импортированных статей с оригиналом 99%. Самые «уникальные» статьи имели сходство 96%. Иными словами никакой уникальности и не было- почти точная копия. Видимо поэтому и не индексировались мои сплоги, а если и индексировались, то позднее выплевывались из индекса. А так как еще стояла ссылка на статью оригинал, то я еще и облегчал задачу по склейке моих сплогов с сайтом- донором.

Вот тут то я и вспомнил про синонимы. Порыскал по сети, нашел словарик на 20 тыс. синонимов, поколдовал над ним, чтобы его привести в нужный вид. Закинул его в скрипт и попробовал импортнуть несколько новостей. Сравнил их с оригиналом и получил уже совсем другой результат: степень сходства статей стала от 2 до 9 процентов, т.е. уже можно говорить об уникальности.

Эх если бы немного подумал или хотя проверил один результат, прежде чем плодить несколько десятков сайтов… Ведь ничего сложного в этом нет. Подготовка словаря заняла по времени один вечер. А сколько доменов было испорчено в итоге. А всему виной лень и авось.

Три домена пока живы. Не знаю правда, достаточно ли будет такого контента для яши, посмотрим. А с ленью надо что-то делать.


Адрес заметки: http://senglab.info/blog/post_1205971364.html


Обязательные для заполнения поля помечены карандашом.


Ваш комментарий к статье
cod

email при указании не будет опубликован.
Адреса с http:// преобразуются в ссылки автоматически.
Для этого отделяйте их от текста ПРОБЕЛАМИ с обеих концов.
Теги запрещены.
Page created in 0.00731 seconds Powered by LastoBlog