Исследования поиск информации в интернет. Законность сбора контактных данных. Проблемы, возникающие в процессе поиска

Законные методы сбора клиентской базы

Внимание! Данная публикация не является юридической консультацией.

важнейшая часть работы отдела продаж любой компании. Клиентской базы имеют огромную ценность для продажников и маркетологов, потому что инструментарий прямых адресных продаж и ремаркетинга даёт наилучший результат в соотношении цена/качество. В телемаркетинге персональные данные нас интересуют в основном как контактные данные для формирования базы потенциальных клиентов.
Существует множество способов получения такой базы контактных данных потенциальных клиентов, но не все они легальны. Давайте разберёмся, какие методы сбора базы контактных данных законны, а какие — нет.

Первое, что вы должны узнать:

Незаконный сбор или распространение сведений о частной жизни лица, составляющих его личную или семейную тайну, без его согласия, наказываются … лишением свободы на срок до двух лет с лишением права занимать определённые должности или заниматься определённой деятельностью на срок до трех лет. (162-ФЗ в ред. от 08.12.2003)

Российское законодательство ревностно охраняет неприкосновенность частной жизни и персональных данных. Правовое поле для оперирования ПДн определяется одним простым принципом, назовём его…

«Главное правило»

Любые действия с ПДн, сведениями о частной жизни и контактными данными физического лица могут быть совершены только с прямого и сознательного согласия субъекта ПДн.

Соответственно, все методы сбора контактных данных можно разделить на те, которые происходят с согласия субъекта персональных данных (законные) и без его согласия (незаконные).

Обговорим сразу: всё сказанное ниже касается прежде всего контактных (персональных) данных физических лиц . Юридическое лицо не обладает персональными данными (в соответствии с Федеральным законом № 152-ФЗ «О персональных данных»). Следовательно, получение согласия юридического лица на обработку его контактных данных не требуется . Исключение составляют данные, являющиеся коммерческой тайной и попадающие под действие авторского права или лицензионного соглашения.

Лидогенерация

Пожалуй, единственный законный способ получения контактных данных потенциальных клиентов — когда они сами по собственной воле передают их вам. При этом согласие клиента на сбор и обработку ПДн должно быть дано в явной форме, выражено действием и сохранено в документальной форме : в виде записи в базе данных, собственноручно подписанной анкеты или аудиозаписи. Оператор персональных данных обязан сохранить согласие в исходном виде.

Наиболее распространённые формы в получении контактных данных потенциальных клиентов (лидогенерации): заполнение формы на сайте компании, получение скидочной карты или даже во время телефонного разговора. В любом случае, согласие должно звучать приблизительно так: «согласен на обработку персональных данных, содержащихся в настоящей анкете с целью направления мне указанной выше информации, в том числе на передачу соответствующей информации лицам, привлекаемым к исполнению указанных действий».

Что если купить клиентскую базу?

Огромная ценность контактных данных потенциальных клиентов рождает высокий спрос. А спрос рождает предложение. В интернете вы найдёте сотни предложений о приобретении клиентской базы различных предприятий. Ведь это отличная идея — просто купить контакты клиентов конкурентов и предложить им лучшие условия.

Наиболее распространённый источник таких баз — элементарное воровство сотрудников. Если компания не озаботилась защитой собственной клиентской базы, то рано или поздно её ждёт утечка. Недаром во многих вакансиях для менеджера продаж выставляется требование «наработанная клиентская база».

Давайте вспомним Главное правило : такую базу можно продавать только с согласия на распространение и обработку персональных данных клиентов. Что важнее, если ПДн были получены без согласия субъекта данных, то дальнейшее их использование незаконно .

Ст.18 ФЗ «О защите персональных данных» гласит:

Если персональные данные получены не от субъекта персональных данных, оператор… обязан предоставить субъекту персональных данных следующую информацию:
1. наименование либо фамилия, имя, отчество и адрес оператора или его представителя;
2. цель обработки персональных данных и ее правовое основание;
3. предполагаемые пользователи персональных данных;
4. установленные настоящим Федеральным законом права субъекта персональных данных;
5. источник получения персональных данных.

Немалый набор требований. Готовы выполнить их, понимая, что полученные контакты не гарантируют продаж ? Кроме того, покупка украденной базы может быть чревата иском о защите коммерческой тайны . Даже получив согласие субъектов ПДн на обработку и обзвон, вы не сможете воспользоваться ей, если настоящий владелец базы обратится в суд.

Законно ли использовать данные из открытых источников?

Согласно 261-ФЗ:

«В целях информационного обеспечения могут создаваться общедоступные источники персональных данных (в том числе справочники, адресные книги). В общедоступные источники персональных данных с письменного согласия субъекта персональных данных могут включаться его фамилия, имя, отчество, год и место рождения, адрес, абонентский номер, сведения о профессии и иные персональные данные, сообщаемые субъектом персональных данных».

Давайте обсудим законность использования контактных данных физических лиц, полученных из открытых источников , например, «Жёлтых страниц». Данные базы могут использоваться по-разному, но главным образом, конечно, для контактов посредством отправки электронных писем, СМС-сообщений или совершения звонков. Тем не менее, осуществление такого сбора данных – это нарушение федерального закона «О персональных данных», поскольку обработка персональных данных может осуществляться только при согласии субъекта .

Несмотря на то, что пользователи действительно выкладывают свои данные в открытых источниках, статья 6 федерального закона «О персональных данных» все равно обязывает получать согласие на обработку персональных данных . Обязанность предоставить доказательство получения согласия субъекта персональных данных на обработку его персональных данных или доказательство наличия оснований возлагается на оператора.

Если информация из открытых источников была получена без согласия субъекта данных, то дальнейшее ее использование будет незаконным.

Это утверждение верно и для парсинга данных из открытых источников. Парсинг — это автоматизированный сбор информации из источника данных. Например, сбор контактных данных пользователей с сайтов, социальных сетей или из базы данных 2Gis. В интернете полно предложений по парсингу 2Gis или Avito, однако сбор данных пользователей с сайтов объявлений или социальных сетей незаконен.

ВКонтакте

Летом 2017 года Роскомнадзор высказал свою позицию относительно сбора и использования данных пользователей социальной сети:

В соответствии с пунктом 5.12 пользовательского соглашения сети «ВКонтакте», пользователь дает согласие только на доступ к информации, которую он размещает на персональной странице, в том числе к своим персональным данным. Согласия на сбор, обработку и передачу третьим лицам пользователь не дает. Если сбор делался ранее, то такая практика должна быть прекращена.

Пресс-служба Роскомнадзора

Эта позиция вызывает много критики, в том числе и со стороны юристов, потому что частично противоречит установленным нормам о персональных данных и собственной позиции РКН от осени 2016 года: управление Роскомнадзора по Тверской области в письменных возражениях, представленных в судебный процесс, указывало, что персональные данные из «ВКонтакте» являются общедоступными, а значит — открытыми для обработки.

«ВКонтакте» запрещает автоматизированный сбор информации о пользователях в своём пользовательском соглашении. В тоже время в соцсети существует форма авторизации для сторонних сайтов, использование которой подразумевает согласие пользователя на обработку данных о нем. Компания, получившая доступ к данным, может использовать их по своему усмотрению .

2Gis

Хотя, контактные данные юридических лиц не являются персональными данными , 2Gis тоже активно борется с парсингом. База данных 2Gis является продуктом интеллектуальной деятельности и на неё распространяется авторское право.

В соответствии с лицензионным соглашением

ЗАПРЕЩАЕТСЯ копирование, воспроизведение, переработка, распространение, размещение в свободном доступе (опубликование) в сети Интернет, использование в средствах массовой информации и/или коммерческое использование картографических материалов и справочно-информационных материалов, как прямо извлеченных из баз данных, включаемых в состав Программных продуктов и/или Онлайн-сервисов 2ГИС, так и полученных путем копирования результатов обработки данных с использованием Программных продуктов и/или Онлайн-сервисов 2ГИС, а также производных от таких материалов продуктов (с дополнениями, сокращениями и прочими переработками).

Лицензионное соглашение 2Gis прямо запрещает автоматический/ручной парсинг и коммерческое/бесплатное распространение информации из баз данных 2Gis . Создавая, заказывая или используя парсеры 2Gis, вы нарушаете лицензионное соглашение, это может стать причиной судебных исков.

Однако есть и полностью легальный способ получить выгрузку базы 2Gis — использовать API 2ГИС . Мы партнёры 2Gis и предоставляем полностью законный доступ к API 2Gis через интерфейс программы Call Office . Это самый удобный и законный способ получить базу контактных данных компаний для обзвона.

Получается, всё нельзя?!

Российское законодательство строго в отношении сбора и обработки персональных данных. Однако у нас осталось несколько простых способов сбора контактных данных потенциальных клиентов.

ВВЕДЕНИЕ

Сеть Интернет похожа на огромную мировую библиотеку, имеющую только одно, но существенное отличие: для поиска книги в библиотеке есть каталог, в крайнем случае, можно обратиться к опытному библиотекарю. Полного каталога Интернета не существует. Но, тем не менее, поиск в глобальной компьютерной сети возможен, и это, пожалуй, является одной из наиболее важных его сторон. Для поиска данных в сети используются специальные серверы, информация на которых поддерживается и обновляется практически автоматически.

Сегодня, когда Интернет стал одним из основных источников информации, поиск в Сети приобретает все большую практическую ценность. Но с быстрым увеличением объема доступных данных все более усложняется и сама процедура поиска.

Интернет – это глобальная компьютерная сеть, которая связывает между собой как пользователей компьютерных сетей, так и пользователей ПК. Интернет медленно, но верно становится основным средством корпоративного общения, уступая пока телефону.

В Сети наличествует гигантское количество информационных ресурсов. По некоторым оценкам, число документов превысило 65 млн. и продолжает стремительно расти. Такой объем информации требует правильной организации процесса поиска и применения специальных технических средств, таких как поисковые машины. Простой поиск по достаточно распространенному ключевому слову дает обычно от десятков тысяч до нескольких миллионов ссылок. Очевидно, что работа с таким большим количеством документов практически невозможна, тем более что подавляющая их часть содержит информацию, не относящуюся к делу.

Источники информации в Интернете различаются по способу представления информации, а следовательно, и по методу доступа к ним.

1 СРЕДСТВА ПОИСКА

1.1 Средства поиска файлов

Поиск файла вручную в сложной структуре каталогов ftp-сервера может занять достаточно много времени. Для упрощения и ускорения поиска была разработана поисковая служба Интернета Archie, представляющая собой специальные Archie-сервера, хранящие содержание каталогов анонимных ftp-серверов. При обращении с поисковым запросом на Archie-сервер результатом поиска является список адресов анонимных ftp-серверов, на которых имеется искомый файл.

Но возникает задача отыскать среди множества файлов этого сервера искомый, что достаточно сложно из-за маловыразительных и непонятных имен файлов и каталогов. Для решения этой проблемы используется система Gopher, позволяющая перемещаться по системе контекстных меню, показывающих содержимое фай лов с использованием понятых обозначений. Существует очень много Gopher-серверов, которые содержат архивы данных в виде иерархически структурированных каталогов, упорядоченных по содержанию. Работа с ними очень проста и соответствует работе с обычным отображением файловой системы.

Существует расширение этой системы - Veronica, которое содержит в своей базе данных каталоги всех Gopher-серверов. После ввода поискового запроса Veronicaавтоматически просматривает все Gopher-каталоги на наличие искомой информации и тем самым избавляет от долгого поиска вручную по многим Gopher-серверам.

С таким способом навигации Gopherв определенной степени был предшественником WWW. В настоящее время применение Gopherуменьшается пропорционально росту использования WWW.

1.2 Средства WWW - WorldWideWeb (Всемирная сеть)

В 1993 году была разработана информационно-поисковая система WWW, которая благодаря простоте навигации и доступности открыла информационные источники Интернета неподготовленным пользователям. WWW вызвал бум в сети Интернет, который продолжается по настоящее время, и объемы доступной информации Интернета ежегодно удваиваются.

WWW основывается на принципе гипертекста (уже знакомого читателю), то есть на системе документов, связанных гиперссылками. Гипертекст представляет собой ключевые Слова, особым образом выделенные из обычного текста. Гипертекстовые ссылки отправляют пользователя на другие документы того же сервера либо на другие сервера, которые могут располагаться в любом месте Интернета. Если этот текстовый документ тоже гипертекстовый, то его ссылки позволяют перейти далее на соответствующие документы. Каждая переадресация происходит для пользователя незаметно, так что он может просматривать информационный состав Интернета но содержательному принципу, не заботясь об адресации конкретных компьютеров.

С развитием мультимедийных приложений изначально чисто гипертекстовые документы все больше и больше становятся гипермедийными. Таким образом, WWW-документы могут существовать в любом формате данных: текст, графика, звук/музыка или видеоклип. Ориентация и навигация во Всемирной сети происходят с использованием специальных программ, называемых WWW-браузерами, обеспечивающими пользовательский интерфейс, как, например, NetscapeNavigator или MicrosoftInternetExplorer.

Отправной точкой поиска информации служит, как правило, основная (базовая, домашняя) страница (сайт) информационного ресурса, которой можно достичь, введя соответствующий адрес в браузере (например, http://ncpi.gov.byили www.iparegistr.com). WWW-сайты создаются и обновляются фирмами либо специальными организациями, публикующими информацию и следящими за содержанием своих WWW-страниц. Использование WWW, таким образом, не является пассивным, и каждый пользователь Интернета при помощи специальных программ-редакторов гипертекста может самостоятельно создавать собственные интерактивные WWW-страницы. Это и открыло путь для растущей коммерциализации и расширения Интернета.

В настоящее время вновь создаваемая информация, как правило, изготавливается с учетом необходимости обеспечения WWW-доступа, а более ранние документы постепенно преобразуются под него, однако во всем мире существуют еще миллионы файлов в форм отличных от требований WWW. Для использования этой информации и через WWW в браузеры включены вышеописанные службы Интернета, обеспечивающие доступ к ней (telnet, ftp, Archie, Gopher). Через WWW можно использовать и другие службы Интернета, которые предназначены для общения (eMail, NetNews). Поэтому WWW-браузер стал в настоящее время универсальной коммуникационной программой Интернета.

С появлением WWW-службы и начался бум в сети Интернет. Благодаря этой простой в применении и единой для всех служб пользовательской среде Интернет заинтересовал множество людей и организаций. Оказалось вдруг, что не надо быть специалистом в области Интернета, чтобы пользоваться службами сети. Это можно сравнить с успехом фирмы Microsoft, связанным с выпуском MicrosoftWindows в качестве графической пользовательской оболочки. До появления Windows у каждого DOS-приложения было собственное руководство пользователя и тем самым требовалось отдельно изучать каждое приложение.

2 ОСНОВНЫЕ ПРИЕМЫ ПОИСКА ИНФОРМАЦИИ В ИНТЕРНЕТЕ

2.1 Основные требования к поиску

К результатам поиска предъявляются требования полноты охвата ресурсов, достоверности полученной информации, минимальных затрат времени и максимальная скорость поиска.

Требование полноты охвата ресурсов не нуждается в дополнительных пояснениях, за исключением необходимости использовать при поиске ресурсы не только WWW, но и других служб Интернета.

Достоверность информации, учитывая природу Интернета, становится чрезвычайно важным требованием. Оценка достоверности может производиться как традиционными методами (проверка легальности публикаций на бумажных носителях, получение сведений об организациях и авторах, выяснение действительности их электронных ресурсов и т.п.), так и с Использованием возможностей Интернета (ознакомление с альтернативными источниками информации, сверка фактического материала, установление частоты его использования другими источниками; выяснение статуса документа и рейтинга источника средствами поисковых систем, получение информации о компетентности и статусе автора материала с помощью специальных поисковых сервисов Интернета; анализ отдельных элементов организации сайта с целью оценки квалификации поддерживающих его специалистов и другое).

Время поиска, не считая затрат времени, связанных с техническими характеристиками подключения, в основном зависит от планирования поиска и навыков работы специалиста по поиску с ресурсом выбранного типа. Планирование поиска заключается в определении требуемых для разрешения поискового требования поисковых служб и порядка их применения. Кроме того, многое зависит от навыков и опыта конкретного специалиста по поиску.

Как уже отмечалось, информация в Интернете доступна из источников разного типа. Прежде всего - это WWW-ресурсы (гипертекстовая система, каталоги ресурсов, поисковые машины). Кроме того, это уже известные читателю электронная почта, почтовые роботы, Usenet и другие телеконференции, а также ftp-системы и архивы (с применением Gopher и Veronica). WWW позволяет производить поиск требуемых ресурсов на основе своих гиперсвойств, то есть имеющиеся поисковые системы работают с использованием гиперссылок в автоматическом режиме, не исключая возможности ручного просмотра. В WWW имеется целый ряд поисковых сервисов как общего, так и специализированного назначения.

Каталоги ресурсов представляют собой базы данных с адресами ресурсов Интернета и самыми разными тематиками. Обычно они имеют иерархическую структуру, привычную для пользователя, и некоторые средства поиска по ней. Эти каталоги в большей своей части обслуживаются специалистами по классификации, то есть предопределяется некоторый субъективный подход к отбору информации, который, с одной стороны, несколько гарантирует достоверность информации, но с другой - предопределяет возможность отсутствия (пропуска) части информации, а также се запоздалое размещение в каталоге.

Поисковые машины - это механизм автоматического построения ссылок (индексов) на различные ресурсы. Поисковые машины могут быть ориентированы на глобальные, специализированные или локальные ресурсы. По сути они являются мощными ИПС, которые с помощью специальных программ-роботов (так называемых "пауков") постоянно осуществляют автоматический поиск требуемой информации в Интернете. Созданные на этой основе специализированные БД обеспечивают поиск информации по запросам пользователей на основе специальных ИПЯ. Правда, охват просматриваемой информации зависит от применяемых алгоритмов и даже для мощных поисковых машин оставляет желать лучшего.

Электронная почта применяется в Интернете и в WWW. Адреса при этом попадают в поисковые системы и доступны поисковым машинам.

Почтовые роботы - это специальные программы, способные отвечать определенными действиями на команды, поступающие им, но электронной почте. Их основное назначение - пересылка данных по запросу в случае, когда те недоступны иным способом, а также как альтернатива работы в режиме online с каким-либо из известных ресурсов, например ftp-архивами. Адрес почтового робота имеет формат электронной почты. При поиске почтовые роботы обычно используются лишь как посредники при получении информации. Иногда приходится сталкиваться с тем, что они оказываются единственным средством получения нужных сведений.

Usenet и другие региональные и специализированные телеконференции представляют собой электронные "доски объявлений", где пользователь размещает свою информацию в одной из тематических групп новостей, передаваемых подписчикам соответствующей тематики. Этот ресурс наиболее значим для быстрого накопления информации, но узкому вопросу, а при поиске - чаще для получения частной, неофициальной информации.

Ресурсы, доступные по telnet, в ряде случаев представляют собой совершенно уникальную информацию, прежде всею по библиотечным каталогам европейских и американских университетов, а также государственных учреждений.

Как уже отмечалось, система файловых архивов ftp имеет достаточно обширные ресурсы ценной информации, до сих пор не переведенной в WWW. Архивы ftp представляют собой в первую очередь источники получения программного обеспечения. Поиск в них может представлять определенный интерес при знании структуры архивов; построения файловых систем, имен файлов и каталогов, содержащих требуемые ресурсы.

2.2 Методика поиска информации в Интернете

Поиск необходимой информации в Интернете можно осуществлять различными способами:

· Поиск с помощью поисковых машин по ключевому слову

· Поиск с помощью классификаторов поисковых машин

· Каталоги и коллекции ссылок (более общие понятия)

· Конференции, чаты

· Страницы ссылок (“Links”) на тематических сайтах (редкие, специализированные вещи)

· Несетевые способы (советы друзей, знакомых; реклама в печатных изданиях)

В начале поиска информации необходимо определить ее тип. Условно можно выделить 4 типа информации.

1 тип - общая (например: история Российской империи),

2 тип - менее общая (например: император Александр II),

3 тип - конкретная (например: реформы Александра II),

4 тип - более конкретная (например: отмена крепостного права).

В зависимости от типа информации определяются и пути поиска.

Информация 1 типа ищется с помощью классификаторов поисковых машин (из российских - рекомендуется Яндекс www.Yandex.ru). Если сразу сайты с требуемой информацией не находятся, то следует просматривать найденные по классификатору каталоги и страницы ссылок (“Links”), которые находятся сайтах подобной тематике. Эти сайты приводятся в классификаторе по теме и найденных каталогах.

Информация 2 типа ищется подобно поиску для 1 типа, но с преимуществом поиска по каталогам и страницам ссылок.

Информация 3 типа - по ключевым словам, которые вводятся в строку поиска поисковых машин, каталогам, страницам ссылок

Информация 4 типа - по подробным данным, которые вводятся в строку поиска. Данные находятся согласно способам поиска изложенных для 2 и 3 типов.

Поиск по 1 типу. Требуемая информация: «История Российской империи».

Заходим в Яндекс - Наука и образование / Общественные науки / История. По описанию темы находим сайт http://rus-hist.on.ufanet.ru.. Если в нем нет необходимой информации, то переходим на страницу ссылок этого сайта. На ней имеются ссылки на каталоги ресурсов: www.history.ru, http://www.lants.tellur.ru/history/index.htm. В них, скорее всего, будут найдены сайты по на заданную тему.

Поиск по 2 типу. Требуемая информация: «Император Александр II».

Поиск осуществляется аналогично предыдущему, но больше внимания уделяется работе с каталогами www.history.ru, http://www.lants.tellur.ru/history/index.htm .

Поиск по 3 типу. Требуемая информация: «Реформы Александра II»

Здесь появляется новый способ поиска - по ключевым словам. Пишем в строке поиска Яндекса «Реформы Александра II». Результат для просмотра - 1790 страниц, которые находятся на 170 сайтах, в число которых входят и каталоги. Для сужения информации можно добавить новые ключевые слова - дополнительные факты в уже найденном подборе сайтов, например: «1860-1870 гг.» и т. д. В других поисковых машинах набирается полностью «Реформы Александра II в 1860-1870 гг.». Для поиска заданной информации можно еще использовать “Links”, которые приводятся на найденных сайтах

2.3 Развитие информационного ресурса

Как и другие информационные технологии, Интернет создают разработчики, но в данном случае в основном это создатели ресурсов (начиная от специалистов, ведущих поддержку hard- и software, дизайнеры, художники, редакторы и самое главное - авторы информационных ресурсов). Естественно, создание ресурсов - не самоцель, ресурсы востребуются пользователями сети, то есть теми же специалистами и потребителями ресурсов, среди которых, как уже отмечалось, появляется новый слой - специалисты по datamining, по поиску информации. Информационные ресурсы Интернета, как, впрочем, и другие, в том числе неэлектронные информационные ресурсы (в частности, средства массовой информации), характеризуются определенными состояниями своей деятельности (рис. 9.3).

Ресурс зарождается в соответствии с потребностями общества и его возможностями (в частности, связанными с уровнем технического и социального состояния общества).

По мере возможности происходит "взросление", становление ресурса (или его исчезновение при полном отсутствии востребованности, то есть исчезновение, возможно, не в физическом смысле - сайт может существовать, а именно в смысле востребованности).

При определенном уровне востребованнности и (в том числе и стараниями авторов сайта) происходит его каталогизация, то есть сведения о ресурсе появляются в различных каталогах, соответствующих типу ресурса.

Индексирование, то есть появление ресурса в индексах поисковых машин, происходит при достижении определенных объемов информационного наполнения и востребованности.

При наличии постоянного роста востребованности происходит и постоянное развитие ресурса, в противном случае ресурс угасает и постепенно исчезает из индексов и каталогов.

2.4 Требования к инструментам поиска

Как отмечалось ранее, чертами, присущими профессиональному поиску, являются его полнота, достоверность и высокая скорость. Наиболее серьезным и нетривиальным фактором, определяющим быстроту достижения цели поиска, оказывается планирование поисковой процедуры. Это требует, с одной стороны, выбора типа ресурсов, которые потенциально способны нести информацию, релевантную поисковой задаче, а с другой - выбора инструментов поиска, обслуживающих соответствующее информационное поле, в зависимости от их предполагаемой результативности. Если говорить о наиболее емком на сегодняшний день с точки зрения информационного наполнения WWW-пространстве, то относительное изобилие его поисковых средств делает решение большинства практических задач многовариантным. Построение оптимальной последовательности применения тех или иных инструментов на каждом этапе поиска и предопределяет его эффективность. Помочь решить проблему выбора может четкое представление о видах, назначении и особенностях работы информационно-поисковых систем (ИПС) Интернета.

Реальными носителями информации о ресурсах, которыми располагает Интернет, являются поисковые машины и каталоги. Информационно-поисковые системы Интернета различаются, но принципу отбора информации, который в той или иной степени присутствует и в сканирующей программе поисковой машины, и в деятельности специалистов, производящих каталогизацию. Как правило, различают два основных показателя: пространственный масштаб системы и ее специализация.

При формировании информационного массива поисковая система может следить за обновлением заранее заданного набора документов, каталогов или конечного числа узлов, отобранных по некоторому принципу. Такие системы, реализованные в Интернете, несколько условно можно назвать локальным и. Глобальные поисковые системы в отличие от локальных решают более трудоемкую задачу - по возможности наиболее полный охват ресурсов всего информационно» поля Интернета (WWW или другого), которое они обслуживают. Следствием этого становится возрастание роли механизма, используемого такой системой для постоянного увеличения числа просмотренных сайтов.

Построение региональных и специализированных поисковых сервисов предполагает активную фильтрацию информации. Специализация поисковой системы на базе какого-либо профиля ИЛИ тема тики, будь то правовая направленность, поиск персоналий или файлов мультимедиа в формате МРЗ, может происходить как в глобальном, так и на локальном масштабе. Разумеется, систему проще построить и сопровождать на ограниченном пространстве обновляемых сайтов, что обычно и реализуется на практике.

Региональными поисковыми службами информация фильтруется в основном по имени домена верхнего уровня сервера, например by для Беларуси, ru - для России. Серьезный недостаток таких систем отсутствует учет большого количества ресурсов, размещаемых региональными авторами ресурсов непосредственно в домене com.

Учет региональных особенностей зачастую присутствует и в глобальных поисковых сервисах. Система Lycos, например, ранжирует ответы по региону запроса.

Интернету, исходя из его природы, сопутствует информационный хаос. И только современные средства автоматического индексирования документов способны, учитывая применяемые алгоритмы и возможности технических средств, найти в этом хаосе рациональное зерно. Применение же при поиске ресурсов без поиска по ключевым словам напоминает серфинг, а не серьезную работу с информацией.

2.6 Глобальные поисковые машины WWW

После знакомства с несколькими глобальными поисковыми машинами пользователь, как правило, останавливается на одной-двух, с которыми и предпочитает работать в дальнейшем. При этом выбор поискового сервиса часто происходит совершенно произвольным способом, не на анализе действительных возможностей систем, а на их популярности. Одна из самых крупных и популярных -AltaVista. Система AltaVista отличается гибким языком запросов, требующим, однако, специального изучения. AltaVista обладает многоязыковой поддержкой поискового индекса и возможностью перевода в режиме on-line (то есть непосредственно во время сеанса работы) текста Web-страницы с распространенных европейских языков на английский.

Еще одна известная система - это NorthernLight, имеющая достаточно стандартный набор функций. Система дополнительно дает возможность работы с уникальной коллекцией ссылок (более 6 тысяч), в основном на статьи из периодических изданий. Индексное сопровождение кириллицы (в том числе и русского языка) делает ее вместе с AltaVista неплохим дополнением к региональным российским поисковым системам Рамблер, Yndex и Апорт при русскоязычном поиске.

Поиск и сбор информации в Интернете нуждаются в планировании. Ошибочная логика построения запроса, неоптимизированная последовательность применения инструментов поиска, попытки ускорить поиск - все это не просто затягивает получение результата, но может поставить под угрозу смысл поисковой работы.

Остановимся на нескольких важных моментах, связанных с планированием и первыми шагами таких работ.

Начинать необходимо со всестороннего лексического анализа искомой информации. Следует использовать любое, достаточно достоверное и подробное описание исследуемого вопроса для получения первичных сведений. Таким источником вполне может стать как узкоспециальный справочник, так и электронная энциклопедия общего профиля. На основе изученного материала необходимо сформировать максимально широкий набор ключевых слов в виде отдельных терминов, словосочетаний, профессиональной лексики, сленга, слов-клише и устойчивых словесных штампов, при необходимости на нескольких языках. Заранее следует определить и возможные уточнения поискового запроса- редкие слова, синонимы и антонимы. названия и фамилии, тесно связанные с искомым вопросом. Желательно также заранее предусмотреть возможные нерелевантные отклики на запросы, то есть возможные характеристики поискового шума. После накопления этих предварительных данных можно перейти к получению первичной информации из Интернета.

Основная задача этой стадии учесть особенности Интернета, который является не только носителем технологий, но и традиций, и собственной этики. Сетевая лексика, сленг и написание общеупотребительных слов здесь могут отличатся от принятых.

Сведения о наличии в Интернете необходимых данных лучше всего искать в ранее известном каталоге, поддерживающем поиск по ключевым словам. При решении, например, простых задач типа "Получить текст Конституции Республики Беларусь" или "В каких правовых актах употребляется название родного города" известный сайт или каталог может быть более быстрым способом получения информации, чем автоматический индекс, и обеспечит большую достоверность.

После лексического анализа информации наступает технологический этап. Выбор информационного поля Интернета и поисковых инструментов производится на основе вышеизложенных подходов.

Используются тестовые запросы из одного-двух ключевых слов или фразы, затем анализируется количественный отклик. Содержательный анализ данных позволяет корректировать запросы, но релевантности отклика. В результате тестирования выясняются наиболее представительные источники информации, после чего следует уточнить последовательность применения поисковых инструментов. На этом этап планирования завершается.

В заключение отметим, что при решении задачи сбора информации из Интернета значительную роль играют региональные и специализированные поисковые сервисы. Применение глобальных индексов не для прямого поиска нужных сведений, а для локализации этих поисковых инструментов нередко позволяет сократить сроки решения поставленной поисковой задачи.

ЗАКЛЮЧЕНИЕ

Принимая во внимания все выше сказанное, можно попытаться одним словом определить суть Интернета: это – общение, общение между отдельными людьми и целыми нациями без вмешательства правительственных авторитетов. Эта новая технология с огромной скоростью изменяет облик цивилизации, коренным образом меняя представление человечества о мире и самом себе. Сеть Интернет уже вобрала в себя десятки миллионов человек, более сотни стран, она полностью изменила процессы распространения и восприятия информации. В наш век информационных технологий виртуальная реальность интернет, способствующая стиранию государственных границ, сокращению географических расстояний, ликвидирующая преграды между культурами, становится не менее явственной, чем окружающий нас материальный мир.

С развитием INTERNET появилась возможность быстрого и удобного поиска необходимой документальной информации. Теперь можно не заниматься подбором и изучением огромного количества литературы в книжных магазинах и библиотеках. Информацию можно получить, не выходя из дома или офиса. Для этого нужен только непосредственно сам компьютер, подключенный к INTERNET с установленной специальной программой – браузером, предназначенной для просмотра содержимого Web-страниц.

Благодаря разнообразию поисковых систем, специально разработанным для рядового пользователя, каждый может без труда отсечь заведомо ненужный поток информации, лишь правильно сформулировав цель поиска.

СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ

1. Гринберг А.С., Кашинский Ю.И., Славин Б.С. Введение в правовую информатику. Мн.: НО ООО БИП-С, 2002. С. 303.

2. Гусев В.С. Google: эффективный поиск. Краткое руководство. М., 2006.

3. Информатика для юристов и экономистов./ Под редакцией С. В. Симоновича. СПб.: Питер, 2001.

4. Информатика. Базовый курс. Учебник для ВУЗов, СПб, 2001

5. Компьютерные технологии в юридической деятельности./Под редакцией профессора Н. Полевого. М.: Издательство БЕК, 1994.

6. Рассолов М.М. Информационное право. – М.М.: Юристъ, 1999.-321с.

7. Энциклопедия Интернет, СПб, 2001

8. How the browsers compare//http://www.microsoft.com

Когда нам необходимо найти нужную нам информацию в Интернете, у нас есть несколько способов достичь желаемого. Большинство людей используют поисковики, вбивая необходимый запрос и изучая предоставленную поисковую выдачу. Для определенных целей нельзя обойтись без использования специализированных баз данных (БД) или же сайтов-каталогов.

То, как вы ищите необходимую информацию, зависит только от вашего желания и определяет, как много информации вам придется переработать перед тем как найти то, что вы ищите, и сколько времени на этом понадобится.

Рассмотрим кратко несколько способов поиска:

1. Если вы решили воспользоваться поисковиком для получения общей информации о чем-либо, то выдача из миллионов страниц и многочисленные переходы по ссылкам не должны вас испугать. Но если ваша цель – это поиск конкретной информации, то могут возникнуть проблемы. Этот способ не гарантирует достоверность информации и требует много времени.

С другой стороны, большинство поисковиков, например, таких как Яндекс и Google, позволяют сузить границы поиска. Во-первых, можно воспользоваться фильтрами расширенного поиска. С помощью данных фильтров можно выбрать нужный вам регион, ограничить результаты поиска по дате обновления документов, определить язык документа и многое другое. Во-вторых, в том же Яндексе, имеется «язык запросов». Его суть в том, что для ограничения области поиска можно использовать специальные операторы, которые позволяют:

Получить в выдаче только документы, содержащие запрашиваемое слово в заданной форме

Уточнить наличие и взаимное расположение запрашиваемых слов в документе

Ограничить поиск по типу файла, хосту и т. д.

2. Если вам необходимо найти информацию по определенной теме, то подойдет поиск по каталогам. На подобных сайтах информация систематизирована и структурирована, разбита по темам и подтемам, что упрощает поиск нужного именно вам раздела. Такие сайты редактируются живыми людьми, поэтому чаще всего предоставленным там ссылкам можно доверять. Конечно, такой способ поиска, если вам нужно найти конкретный документ, не особо эффективен, но он хорошо подходит в случаях, когда вам надо найти как можно больше информации по широкой теме.

В Интернете имеется огромное количество каталогов, как специализированных, посвященных одной широкой теме, так и многопрофильных.

В качестве примера можно рассмотреть два крупных, многопрофильных каталога. DMOZ – это один из крупнейших каталог ресурсов Интернета. Если рассматривать сугубо русскоязычные каталоги, то можно выделить list.mail.ru. Далее мы расскажем чуть больше о данных ресурсах.

3. Поиск по базам данных эффективен при тематическом поиске. Сбор нужной нам информации в зарубежных и русскоязычных информационных, образовательных и научных ресурсах очень часто требует больших усилий и может стоить значительных затрат средств и времени.

В Сети существует огромное количество баз данных - фактографических, библиографических, полнотекстовых, объектографических и т.д., которые, в зависимости от содержания хранящейся в них информации, можно подразделить на универсальные, отраслевые и тематические. Например, библиографические базы данных по своей сути являются электронными аналогами традиционных печатных библиографических изданий. Библиографические базы данных, как правило, поддерживают единожды заданный, четкий алгоритм описания документов по определенным критериям. Это способствует нахождению необходимой информации, особенно, если ставится задача найти какую-либо конкретную публикацию, вышедшую в периодическом издании.


Пример. Каталоги.

Каталог сайтов Интернета, или каталог Интернет-ресурсов, или просто Интернет-каталог (англ. webdirectory) - структурированный набор ссылок на сайты с кратким их описанием. Сайты внутри каталога разбиваются по темам.

1. OpenDirectoryProject (ODP, Открытый Каталог (ODP)), также известный как DMOZ (от одного из своих первых доменных имён directory.mozilla.org) - многоязычный свободный каталог ссылок на сайты всемирной паутины, поддерживаемый интернет-сообществом добровольных редакторов.

На данный момент на сайте можно найти:

3,884,779 сайтов

Информация доступна на 90 языках, в том числе нарусском, немецком, английском, греческом, французском, японском, корейском, итальянском и так далее.

На сайте работают 91,790 редакторов.

Основные категории: искусство, бизнес, компьютеры, игры, здоровье, дом, новости, отдых, справочники, регионы, наука, покупки, общество, спорт, каталог для детей и подростков. Каждая из этих основных категорий подразделяется на огромное количество подтем.

DMOZ-ом управляет AOL Inc. (американский медийный конгломерат, поставщик онлайн-служб и электронных досок объявлений). Управлением занимается небольшая команда специалистов, ответственных за редакционную политику и руководство, управление сообществом и его развитие, а также за системное проектирование.

Однако, в первую очередь, DMOZ - это саморегулирующиеся сообщество. С помощью системы самоуправления, редакторы-добровольцы управляют ростом каталога и его развитием, а система сдержек и противовесов обеспечивает высокое качество контента.

DMOZ является открытым источником, основанном на волонтерской инициативе. AOL Inc. Управляет им в большей степени как некоммерческой организацией и стремится сохранить его атмосферу открытого и свободного ресурса.

2. Если говорить о русскоязычных каталогах, то можно выделить Каталог@mail.ru. По аналогии с DMOZ, здесь есть основные темы, которые потом разбиваются на более мелкие. Всего 18 основных категорий: автомобили, интернет, медицина и здоровье, новости и СМИ, производство, бизнес и финансы, компьютеры, наука и образование, спорт и так далее.

Для удобства пользователей внутри каждого раздела можно видеть разбивку всех имеющихся по этой теме ссылок по:

Типам сайтов (информационные, корпоративные, персональные, сайты-сервисы, частные, информационно-сервисные)

Так же можно сортировать выдачу по алфавиту, дате и популярности.

Каждый день Каталог@mail.ru предоставляет топ самых посещаемых сайтов за день из тех, что имеются в каталоге.


Пример. Базы данных.

Espacenet (ранее часто упоминался как esp@cenet) это бесплатный онлайн сервис для поиска патентов и патентных заявок. Espacenet разработан Европейским патентным ведомством (ЕПВ) совместно с государствами-членами Европейской патентной организации. Большинство государств-членов имеют возможность пользоваться Espacenet на своем государственном языке и имеют доступ к Всемирной базе данных ЕПВ, большинство из которых на английском языке. В 2015 году Espacenet утверждали, что у них зарегистрированы записи о более чем 90 миллионов патентных публикациях.

Проект Espacenet был запущен впервые в 1998 году, совершив революцию в сфере международной патентной информации, сделав её общедоступной и тем самым навсегда изменив порядок распространения, проверки и поисков патентов.

В 2012 ЕПВ запустило проект «PatentTranslate», бесплатный онлайн-сервис автоматического перевода патентов. Этот сервис был созданный в партнерстве с Google и был "специально построен так, чтобы обрабатывать сложную патентную лексику". «PatentTranslate» охватывает 31 язык.

С марта 2016 года, Espacenet начали предлагать полнотекстовый поиск по базе английских, французских и немецких патентных документов.

Пример. Поисковик.

Поисковая система - это компьютерная система, предназначенная для поиска информации. Одно из наиболее известных применений поисковых систем - веб-сервисы для поиска текстовой или графической информации во Всемирной паутине.

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами.

В архитектуру поисковой системы обычно входят:

Поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,

Индексатор, обеспечивающий быстрый поиск по накопленной информации, и

Поисковик - графический интерфейс для работы пользователя.

На данный момент у пользователей есть широкий выбор, каким именно поисковиком они хотят воспользоваться для нахождения необходимой им информации: Google, Bing, Yahoo!, Яндекс, Рамблер и так далее.

В качестве примера мы рассмотрим поисковую систему Bing. Bing является относительно молодым поисковым сервисом, впервые заявившим о своем существовании лишь в 2009 году, и был представлен генеральным директором Microsoft Стивом Балмером. Однако, несмотря на свою молодость, данная поисковая система уже сегодня в некоторых европейских странах, а также странах Северной Америки уступает по своей популярности лишь поисковому гиганту компании Google.

Bing наиболее популярен в таких странах как: США, Китай, Германия, Индия и Великобритания.

Поисковик обладает лаконичным внешним видом, а для нахождения информации можно использовать также категории «Изображения», «Видео», «Карты», «Новости». Кроме того, Bing имеет своего переводчиком на базе MicrosoftTranslator. К особенностям данного поисковика можно отнести то, что прямо в поисковике, без установки на компьютер, можно пользоваться лицензионным продуктами MicrosoftOffice.

Если оценивать данный сайт как источник информации, то можно столкнуться с одной особенностью, которая усложняет быстрый и точный поиск. Особенность поискового алгоритма Bing является его отношение к плотности ключевых слов. Если для успешного продвижения в других поисковых системах тексты сайта должны содержать от 5 до 8% ключевых слов, то Bing считает естественной плотностью ключей цифру в 3%. Таким образом, вероятность того, что по вашему запросу могут быть предоставленный ссылки на сайты, не содержащие нужной информации, повышается.

Как и у конкурентов, в Bing есть возможность фильтрация выдачи по временному периоду, языку и региону.


ЗАКЛЮЧЕНИЕ

Интернет образует гигантское хранилище данных по всем отраслям человеческого знания. Виртуальные библиотеки, архивы, ленты новостей содержат огромное количество текстовых, графических, аудио- и видеофайлов – всемирная компьютерная сеть, предоставляет нам огромное количество открытой информации. И ориентироваться в этом информационном потоке, находить нужное – очень важно для человека 21 века.

Мы ознакомились с такими видами открытых источников информации сети Интернет, как каталоги, базы данных и поисковые системы на частных примерах и рассмотрели, как происходит поиск информации в рамках данных ресурсов.

Источники

1) Статья «Сбор информации из открытых источников» [Электронный ресурс] // Всепоиск, 2015, URL: http://www.vsepoisk.ru/2009/03/blog-post_27.html (Дата обращения: 13.12.2016)

2) Официальный сайт DMOZ [Электронный ресурс] // DMOZ, 2016, URL: http://www.dmoz.org/ (Дата обращения: 13.12.2016)

3) Официальный сайт Каталог@Mail [Электронный ресурс] // Mail.ru, 2016, URL: http://list.mail.ru/ (Дата обращения: 13.12.2016)

4) Официальный сайт Espacenet [Электронный ресурс] // Espacenet, 2015 URL: http://www.epo.org/index.html (Дата обращения: 13.12.2016)

5) Статья «Ищем в базах данных» [Электронный ресурс] // Всепоиск, 2015, URL: http://www.vsepoisk.ru/2009/04/blog-post_08.html (Дата обращения: 13.12.2016)

Парсер – это программа для автоматизации процесса парсинга, то есть обработки информации по определенному алгоритму. В этой статье я приведу несколько примеров программ-парсеров и в двух словах опишу их назначение и основные функции.

Парсер контента X-Parser

Основные функции программы также состоят их нескольких программных блоков.

  • Парсер вылачи любых поисковых систем по ключевым запросам
  • Парсер контента с любого сайта
  • Парсер контента по ключевым запросам из выдачи любой поисковой системы
  • Парсер контента по списку URLов
  • Парсер внутренних ссылок
  • Парсер внешних ссылок

Программа WebParser

Парсер WebParser представляет собой универсальную программу. основная функция которой — парсинг поисковых систем. Работает с ПС Google, Яндексом, Рамблером, Yahoo и некоторыми другими. анализирует движки (CMS) сайтов. Совместима со всеми версиями Windows, начиная с W2000. Болле полную информацию .

Плагин WP Uniparser

Не забудем и плагин для WordPress WP Uniparser . О нем можно больше узнать, пройдя по этой ссылке .

Парсер «Магадан»

Парсер ключевых слов c романтическим названием «Магадан» создан именно для целевой обработки ключевых слов Яндекс.Директа. Полезен при составлении семантического ядра, подготовке рекламных компаний и для сбора и анализа информации.

В завершение стоит упомянуть о языке программирования для создания сайтов Parser , созданного на студии Артемия Лебедева и служащего для разработки сайтов. Этот язык будет несколько посложнее, чем обыкновенный HTML, но не требующий такой основательной подготовки, как, например, язык PHP.

Под маркетинговыми исследованиями понимается систематический сбор, отображение и анализ данных по разным аспектам маркетинговой деятельности.

Маркетинговые исследования -- это функция, которая через информацию связывает маркетологов с рынками, потребителями, конкурентами, со всеми элементами внешней среды маркетинга.

Первичная информация - это информация, которую исследователь самостоятельно получает специально для решения проблемы маркетингового исследования.

Для сбора информации о потребительских предпочтениях и предпочтениях квалифицированных специалистов в области методов сбора, источников информации в Интернете, использован метод опроса.

Опрос заключается в сборе первичной информации путем прямой постановки респондентом вопросов относительно уровня их знаний, отношению к продукту, предпочтений и покупательского поведения.

В зависимости от типов респондентов был выбран опрос, с участием категории населения, профессиональная деятельность которых не связана с предметом анализа.

Маркетинговое исследование проводилось с целью выявление особенностей поиска и использование информации в сети Интернет. Целевой аудиторией данного исследования является население Республики Беларусь до 18 лет и старше. Сбор данных проводится в городе Гомеле.

Для определения необходимого объема выборки была использована формула:

где n - объем выборки;

z - нормированное отклонение, определяемое исходя из выбранного уровня доверительности;

p - найденная вариация для выборки;

e - допустимая ошибка.

Следовательно, объем вариации равен человек.

Любое маркетинговое исследование начинается с определения проблемы. Так, в нашем исследовании, проблема, требующая исследования, будет формулироваться следующим образом: « Как потребители относятся к использованию и поиску информации в сети Интернет?

Поисковые вопросы уточняют отдельные компоненты проблемы, каждый из которых может быть в свою очередь разбит на составляющие -- поисковые вопросы. Поисковые вопросы определяют круг конкретной информации, которая потребуется для решения проблемы исследования. Так, поисковыми вопросами, в нашем исследовании могут выступать следующие: 1. Кто является пользователем поисковых машин»: каков пол, возраст, уровень дохода, социальный статус. 2.Какую поисковую машину выбирают пользователи? 3.Какие сайты чаще всего посещают пользователи? 4.С какой целью пользователи используют Интернет? 5.Какая информация наиболее интересна в Интернете? На основе поисковых вопросов можно сформулировать гипотезы: 1.Пользователи выбираю поисковую машину Google 2. Чаще всего пользователи поисковых машин являются население в возрасте:от19-25лет 3.Пользователи чаще всего посещают развлекательные сайты 4.Большинство пользователей используют Интернет для общения 5. Для пользователей наиболее интересна информация о развлечениях и отдыхе 6.Большинство пользователи находят нужную информацию 7. Пользователи пользуются Интернетом чаще дома

В сентябре - ноябре 2011 года было проведено маркетинговое исследование, в процессе которого было опрошено 150 граждан проживающих в городе Гомеле. Опрашиваемым было предложено заполнить анкету, состоящей из 17 вопросов. Временной период исследования составляет 12 недель с учетом составления анкеты и обработки полученных данных.

Для выявления предпочтений потребителей была разработана анкета (ПРИЛОЖЕНИЕ А).

В процессе маркетингового исследования при опросе респондентов были были выявлены следующие возрастные группы потребителей.(рис 3.1)

Рисунок 3.1- Диаграмма распределения респондентов по возрасту

Как видно из рисунка 3.1 по возрастному критерию использование поисковых систем большую доля составляют респонденты, чей возраст находится в приделах 19-25 лет, что составляет 35%. Граждане, чей возраст находится в приделах 56 лет и старше, составило в процентном отношении 3%. Целевая аудитория с точки зрения их сферы деятельности представлена на рисунке 3.2.

Рисунок 3.2 - Диаграмма распределения респондентов по социальному статусу

Анализируя ответы респондентов, можно сделать вывод, что значительная часть пользователей поисковых систем - это служащие (36 %) и рабочие (30 %). Далее с небольшой разницей следуют студенты(17 %) и предприниматели (15 %).

Полученные данные об уровне дохода населения представлены на рисунке 3.3

Рис. 3.3

Из рисунка 3.3 видно, что большее количество опрошенных респондентов имеют средний уровень дохода, который находится в приделах от 1 000 000 до 2 000 000 рублей, что составило 65,3%. Опрашиваемые с низкий уровень дохода составили 26,3%, а с высоким - 8%.

Рис. 3.4

Из рисунка 3.4 видно, что количество видов и наименований поисковой системы очень велико. Наибольшей популярностью пользуется системы Google.-45%, за тем Mail.ru, потом Yandex-20% и на последнем месте Rambler-10%. в целом существует большое различие в потребительских предпочтениях Google, Mail.ru, Yandex и Rambler наблюдается.

Рис. 3.5

Рисунок 3.5 показывает, что сайты которые посещают чаще других.- это развлекательные-35%, за тем информационные -33%,потом корпоративные-25% и другое-7%

Рис. 3.6

Из рисунка видно, что большинство опрошенных респондентов пользуются поисковыми системами-90,2%

Рис. 3.7

По результатам исследования было выявлено, что для 61 % опрошенных поисковая системв является удобное средство коммуникации, для 34% простой эффективный способ нахождения информации и для 5% что-то другое. Наглядно структура ответов представлена на рисунке 3.7

Рис. 3.8

Данное исследование дало информацию о частоте пользовании интернетом, где потребители которые посещают интернет ежедневно составило-74%, 3-4 раза в неделю- 16% и 3-4 раза в месяц-10 Наглядно структура ответов представлена на рисунке 3.8

Рис. 3.9

Как видно из рисунка 3.9 большинство респондентов пользуются интернетом дома(75%), 16% на работе, 5% в гостях и 4% в интерет кафе.

Рис. 3.10

Рисунок 3.10 показывает, что респонденты чаще всего пользуются интернетом для общения(48%),а так же поиск информаии(26%),просмотр новостей (19%) и почта(7%)

Рис. 3.11

По результатам исследования было выявлено, что для 44 % опрошенных наиболее интересна информация о отдых и развлечение-44%, интернет-42%,бизнес 31%,компьютеры 29%, общество 27%, наука и образование 25%, культура и искусство 20%, медицина и здоровья 19%,дом и семья 18%. Наглядно структура ответов представлена на рисунке 3.11

Рис. 3.12 - Диаграмма распределения респондентов по ответу на вопрос: « Удается ли Вам найти нужную информацию в сети?», %

Из рисунка 3.12 видно, что большее количество опрошенных респондентов всегда находят информацию которую ищут-52%, за тем часто находят -33%, редко -12%, никогда 3%.

Таким образом, в ходе опроса были выявлены следующие предпочтения потребителей: большинство опрошенных предпочитают поисковую систему такую как Google, при этом, использование Mail.ru и не имеет большого разрыва между собой (5,%).

35% выборки чаще всего посещают развлекательные сайты.58% потребителей посещают Интернет ежедневно, но как показал анализ, посещение ежедневно увеличивается. И делая прогноз на будущее роста предвидеться. Поэтому разработчикам поисковых систем нужно:

Совершенствование алгоритмов поиска (или разработку новых стратегий поиска), и на сопутствующие «навороты» типа дизайна и дополнительных сервисов;

Обеспечить разбор запросов (вопросов), заданных естественным языком;

Индексировать поисковики внешние файлы CSS;

Увеличить размер документа или размер той части, что будет проиндексирована

Обзор