Webparser - автоматический парсер контента / статей

Скачать Webparser - автоматический парсер контента / статей
Недавно искали:

Itnull

Команда форума
Администратор
Регистрация
22.05.13
Сообщения
25.548
Реакции
9.496
Веб-сайт
itnull.me
  • Автор темы
  • Администратор
  • Модер.
  • Команда форума
  • #1
WebParser - автоматический парсер контента (статей)

Создан для сбора статей, текстов, любого контента со сторонних сайтов, источников.
Встроенный уникализатор текста, повышает индексность поисковыми системами.
Для работы скрипта требуется только адрес(url) cайта, желаемый раздел или разделы и все, остальное делает скрипт, автоматически определяет контент и вытаскивает его, отделяя его от мусора.
Результат работы скрипта - готовые статьи для ваших сайтов, также возможен экспорт полученных статей в форматы: TXT, HTML, PHP

Порядок работы:

1. Вводите в скрипт url сайта со статьями.
2. Скрипт заходит на все страницы сайта и грузит оттуда статьи.
3. Скрипт сам отбрасывает мусор со страницы, оставляя только статью.

Вы можете:

1. Указать с каких разделов сайта нужно парсить статьи.
2. Указать какие слова текст должен содержать (например, окна).
3. Указать минимальную длину текста.
4. Использовать автоопределение статьи (скрипт сам определит
статью на странице), либо можете указать шаблон для парсинга
(указываете между какими кусками кода страницы, должна
находиться статья), редактировать полученные статьи, как вручную, так и автоматически.
5. Использовать синонимайзер (база 308 000).
6. Использовать экспорт полученных статей в txt, html, php.
7. Указывать максимальное количество статей

Вы можете экспортировать выбранные статьи:

1. ТХТ – в текстовый формат. Можете экспортировать в один текстовый файлили в несколько, по шаблону.
2. HTML – вы можете указать шаблон для экспорта, на выходе получите архив со страницами.
3. PHP – скрипт экспортирует все статьи в отдельные php страницы

Работает локально на компьютере на денвере и на хостинге(сервере).

Скачать
Скрытое содержимое доступно для зарегистрированных пользователей!
 
Назад
Сверху Снизу