August 2nd, 2007Избягване на duplicate content във вътрешни страници от Пацо
Тук ще стане въпрос не как да избегнем duplicate content на вече съществуващи страници, а как да го избегнем, ако например сме купили стар домейн, който има индексирани страници, които при нас биха дали 404 error.
Много уебмастери слагат код:
ErrorDocument 403 index.php
ErrorDocument 404 index.php
което обаче създава проблема с duplicate content, тъй като редиректва всички ненамерени страници към главната. Друг метод е страниците да се насочат към специално създадени за целта 403 и 404 страници:
ErrorDocument 403 /error403.html
ErrorDocument 404 /error404.html
което пак не е особено елегантно решение.
Понякога от самия хостинг предлагат custom 403 и 404 pages. Аз, обаче, ползвам следното решение:
ErrorDocument 403 http://www.sajta-mi.com/
ErrorDocument 404 http://www.sajta-mi.com/
а именно – чрез външен редирект (R=301) подсказваме на търсачките, че тези страници вече не съществуват, за разлика от първите два случая.
Какво обаче правим с параметрите в УРЛ като q=, page=, id= и т.н., които упорито продължават да стоят? Решението:
От предишната статия за премахване на duplicate content на начална страница преписваме кода:
Options +FollowSymlinks -Indexes
RewriteEngine On
RewriteCond %{HTTP_HOST} ^washiqthost.com$ [NC]
RewriteRule ^(.*)$ http://www.washiqthost.com/$1 [R=301,L]
RewriteCond %{THE_REQUEST} /index.php HTTP/
RewriteRule ^index.php$ / [R=301,L]
и по надолу поставяме следния код:
RewriteCond %{QUERY_STRING} ^page=.*$ [OR]
RewriteCond %{QUERY_STRING} ^q=.*$ [OR]
RewriteCond %{QUERY_STRING} ^id=.*$
RewriteRule .* %{REQUEST_URI}? [R=301,L]
и си решаваме проблема с параметрите.
- SEOПрограмиране Избягване на duplicate content на начална страница Както може би знаете, или не знаете, www.site.com/, www.site.com/index.php, site.com/ и site.com/ind
- Програмиране Частична защита срещу SQL injection с .htaccess Нещо много просто, но ефективно срещу SQL injection. За да може да ползвате кода, трябва да имате Ap
- SEOПрограмиране Създаване на Yahoo sitemap PHP script Макар и по-рядко ползвана, търсачката Yahoo не трябва да се пренебрегва. За разлика от Google sitema
- SEOПрограмиране Домейн и поддомейн на различни хостинги Първата мисъл, която може да ви мине през ума е, че е невъзможно. Е, не е съвсем така. Само, че си и
- SEOПрограмиране Създаване на Google sitemap PHP script Възможно най-простия скрипт за създаване на Google sitemap. Разбира се, директно не може да го ползв
- SEOПрограмиране Cloaking Cloaking най-просто казано е начин, по който се представя едно съдържание на потребителя и друго на
- Програмиране Създаване на applet, youtube и vbox7 bbcode за phpBB3 Една от най-фешън функциите на третата версия на най-популярния форум-софтуер - phpBB е създаването
- SEO Подобни резултати от Google Blogsearch Понеже доста хора ме питат какъв плъгин ползвам за подобни резултати от Google Blogsearch, ще кажа,
- SEO Рубладжии Рубладжии. Не знам чия е инициативата, но с удоволствие се включвам в новата бомба, с която ще срази
- SEO Redirect 301/302 = meta refresh? Грешка! Като за начало да разясним какво представлят Redirect 301, 302 и meta refresh. Машините, върху които
- SEO robots.txt – ефективен SEO инструмент Според едно от последните изследвания в интернет за ползването на robots.txt файла, само 38% от сайт
- Програмиране phpBB с нова версия Няколко месеца след официалното пускане на тройката, phpBB пуснаха новата версия за двойката - 2.0.2
- SEO Експеримент с тайтъл атрибут в линковете Поради слуховете, че тайтъл атрибут в линковете е безполезен за СЕО, се налага да продведем този екс
- SEO Отчитат ли се изписаните URL, като линкове http://bgkulinar.net/test.html Какъв пък е този адрес? Сега ще обясня. Днес, както се ровех в Гугъл
March 2nd, 2008 at 7:41 pm
Avoiding Duplicate Content on Inner Pages
We are going to talk about NOT how to avoid duplicate content on already existing pages but how to avoid it, if for example we have bought old (expired) domain that has many indexed pages that would result in 404 error onaour site.
Some webmasters plac…