August 2nd, 2007Избягване на duplicate content във вътрешни страници
Тук ще стане въпрос не как да избегнем duplicate content на вече съществуващи страници, а как да го избегнем, ако например сме купили стар домейн, който има индексирани страници, които при нас биха дали 404 error.
Много уебмастери слагат код:
ErrorDocument 403 index.php
ErrorDocument 404 index.php
което обаче създава проблема с duplicate content, тъй като редиректва всички ненамерени страници към главната. Друг метод е страниците да се насочат към специално създадени за целта 403 и 404 страници:
ErrorDocument 403 /error403.html
ErrorDocument 404 /error404.html
което пак не е особено елегантно решение.
Понякога от самия хостинг предлагат custom 403 и 404 pages. Аз, обаче, ползвам следното решение:
ErrorDocument 403 http://www.sajta-mi.com/
ErrorDocument 404 http://www.sajta-mi.com/
а именно - чрез външен редирект (R=301) подсказваме на търсачките, че тези страници вече не съществуват, за разлика от първите два случая.
Какво обаче правим с параметрите в УРЛ като q=, page=, id= и т.н., които упорито продължават да стоят? Решението:
От предишната статия за премахване на duplicate content на начална страница преписваме кода:
Options +FollowSymlinks -Indexes
RewriteEngine On
RewriteCond %{HTTP_HOST} ^washiqthost.com$ [NC]
RewriteRule ^(.*)$ http://www.washiqthost.com/$1 [R=301,L]
RewriteCond %{THE_REQUEST} /index.php HTTP/
RewriteRule ^index.php$ / [R=301,L]
и по надолу поставяме следния код:
RewriteCond %{QUERY_STRING} ^page=.*$ [OR]
RewriteCond %{QUERY_STRING} ^q=.*$ [OR]
RewriteCond %{QUERY_STRING} ^id=.*$
RewriteRule .* %{REQUEST_URI}? [R=301,L]
и си решаваме проблема с параметрите.
- Избягване на duplicate content на начална страница Както може би знаете, или не знаете, www.site.com, www.site.com/index.php, site.com и site.com/index.php са 4 различни страници за търсачките, въпреки, че вие вероятно виждате една и съща страница. За да избегнете подобен проблем, трябва да имате Apache server и mod_rewrite модул включен. Някъде в .htaccess пишете: Options +FollowSymlinks -Indexes RewriteEngine On RewriteCond %{HTTP_HOST} ^washiqthost.com$ [NC] RewriteRule ^(.*)$ http://www.washiqthost.com/$1 [R=301,L] RewriteCond %{THE_REQUEST} /index\.php\
- Частична защита срещу SQL injection с .htaccess Нещо много просто, но ефективно срещу SQL injection. За да може да ползвате кода, трябва да имате Apache сървър, включен mod_rewrite и естествено възможност за промяна на .htaccess. Намирате Options +FollowSymlinks RewriteEngine On и на следващия ред слагате RewriteCond %{QUERY_STRING} union [NC,OR] RewriteCond %{QUERY_STRING} select [NC,OR] RewriteCond %{QUERY_STRING} truncate [NC,OR] RewriteCond %{QUERY_STRING} drop [NC,OR] RewriteCond %{QUERY_STRING} update [NC] RewriteRule .* %{REQUEST_URI}? [R,L] По този начин
- Създаване на Yahoo sitemap PHP script Макар и по-рядко ползвана, търсачката Yahoo не трябва да се пренебрегва. За разлика от Google sitemap, където създаваме xml файл, в този случай е прост текстов файл със списък на URL. (Този тип файл може да се ползва и за Гугъл, но те не го препоръчват). И така. отваряте текстов редактор, и записвате в него
- Домейн и поддомейн на различни хостинги Първата мисъл, която може да ви мине през ума е, че е невъзможно. Е, не е съвсем така. Само, че си има няколко изисквания, без които номерът няма да сработи: 1. Хостингът, на който ще се хостват подомейнът трябва да има статично IP. 2. Там, където се хоства домейнът, трябва да има някакъв вид управление на DNS. Започна
- Създаване на Google sitemap PHP script Възможно най-простия скрипт за създаване на Google sitemap. Разбира се, директно не може да го ползвате. Ще се наложи да смените потребителското име и паролата за MySQL-а, а ако хостинга ви е на godaddy, например, ще трябва да извършите това упражнение и за localhost. Промени се налагат и за URL, което тук е във вида
- Cloaking Cloaking най-просто казано е начин, по който се представя едно съдържание на потребителя и друго на търсачките. Води се black hat SEO т.е. търсачките не го обичат много и сайтът ви може да бъде наказан за използване на подобна техника. Все пак добрият оптимизатор трябва да разбира и от тъмната страна. Има много начини за
- Подобни резултати от Google Blogsearch Понеже доста хора ме питат какъв плъгин ползвам за подобни резултати от Google Blogsearch, ще кажа, че това нещо не е точно плъгин, а малко код, който скалъпих, защото не можах да намеря подобен. За да ползваме този код, трябва: 1. Да изтеглим файла rss_fetch.php 2. Да го качим в директорията /wp-includes/ 3. Да сложим следния код във
March 2nd, 2008 at 7:41 pm
Avoiding Duplicate Content on Inner Pages
We are going to talk about NOT how to avoid duplicate content on already existing pages but how to avoid it, if for example we have bought old (expired) domain that has many indexed pages that would result in 404 error onaour site.
Some webmasters plac…