Как убрать дубликаты?

голоса: 0

Новости Харькова. Смотреть новости сегодня Харьков он�
/news/
/news/?page11
/news/?page12
/news/?page6
4
Обыденные новости про ежедневную жизнь Харькова. Разв�
/news/novosti_kharkova/1-0-6
/news/novosti_kharkova/2-0-6
/news/novosti_kharkova/6-0-6
3
Коллекция Фото старого Харькова, фотографии современн
/photo/
/photo/?page2
/photo/?page3
/photo/?page4
/photo/?page5
/photo/?page6
/photo/?page7

 

Харьков во время войны - Фотоальбомы - ЖХ - Жизнь Харько�
/photo/kharkov_vo_vremja_vojny/4-2
/photo/kharkov_vo_vremja_vojny/4-3
/photo/kharkov_vo_vremja_vojny/4-4
/photo/kharkov_vo_vremja_vojny/4
4
Старый Харьков - Фотоальбомы - ЖХ - Жизнь Харькова
/photo/staryj_kharkov_foto/2-2
/photo/staryj_kharkov_foto/2
2
Все новости Харькова 2017
/news/
/news/?page11
/news/?page12
/news/?page6
4
Фотоальбом Харькова - ЖХ - Жизнь Харькова
/photo/
/photo/?page2
/photo/?page3
/photo/?page4
/photo/?page5
/photo/?page6
/photo/?page7
7
Новости Харькова 2016
/news/novosti_kharkova/1-0-6
/news/novosti_kharkova/2-0-6
/news/novosti_kharkova/6-0-6

 

 

Как это убрать, что бы в google.com/webmasters перестали мне эти клоны показывать в разделе Оптимизация HTML

| Автор: | Категория: Google Вебмастер
Изменение категории | | Автор: Yuri_Geruk

Ответов: 1

голоса: 0
 
Лучший ответ
С роботса удалить директиву Allow: /*?page и добавить Disallow: /*? тогда весь этот мусор будет запрещен к индексации.
| Автор:
Выбор ответа лучшим | | Автор: Santoz Santoz
 User-agent: * Disallow: /a/ Disallow: /stat/ Disallow: /index/1 Disallow: /index/2 Disallow: /index/3 Disallow: /index/5 Disallow: /index/7 Disallow: /index/8 Disallow: /index/9 Disallow: /panel/ Disallow: /admin/ Disallow: /secure/ Disallow: /informer/ Disallow: /mchat Disallow: /search Disallow: /shop/order/ Disallow: /?ssid= Disallow: /abnl/ Disallow: /google Disallow: /twitter Disallow: /facebook Disallow: /yandex Disallow: /vkontakte  Вот какой у меня роботс.
Santoz Santoz,
Что тут убрать или добавить?
Santoz Santoz,
Убирать не нужно как вижу, лишь добавить.
Yuri_Geruk,

Добавил в роботс Дисалоу*

Подскажите, что добавить, что бы убрать 

news/?page17 и 
photo/?page3  

То есть с разных модулях, что бы страницы последющие не выскакивали. Спасибо!

Santoz Santoz,
Как я выше говорил, достаточно одного Disallow: /*?
Santoz Santoz,

И по фотоальбому дополнительно, в шаблон страницы альбома в блок хеад прописать:

<?if($PAGE_ID$='category')?>
<?ifnot($CURRENT_PAGE$=='1')?>
<link rel="canonical" href="$HOME_PAGE_LINK$" /> 
<meta name="robots" content="noindex, nofollow"/> 
<?endif?><?endif?> 

...