Где хранится вся информация интернета?

Где хранится вся информация в интернете

  • Total 7

Несмотря на всю популярность Сети Интернет по всей планете, многие пользователи считают технологию какой-то невидимой силой. Хотя по факту, это более чем материальная вещь, за работу которой отвечают мощные компьютеры, сервера и дата-центры, обменивающиеся информацией за доли секунды и соединенные между собой километрами кабелей и оптоволокон. Что же это за хранилища, как устроены дата-центры и как выглядят центры обработки данных крупнейших компаний.

Что такое дата-центр

Как и много других новшеств, изобретению и распространению Интернета люди обязаны военной отрасли. Именно для нее были первые разработки Сети, и именно для связи военных баз их лаборатории решили объединить в сеть (сначала локальную, а теперь повсеместную), которая используется не только в решении военных конфликтов. Сегодня разработка используется для распространения контента любой тематики и любого направления. Загружая информацию на просторы Сети (будь это фото, видео или «цитата дня» от Джейсона Стэйтема), она молниеносно попадает в центр обработки данных (ЦОД).

Дата-центр – это не просто большая флешка, это огромные здания похожие на крепости, заполненные серверами, оптическими кабелями и проводами. На работу и обслуживание современного хранилища затрачивается столько же электроэнергии, как для обслуживания небольшого городка. Использование дата-центров позволяет решать одновременно несколько задач:

  • круглосуточная и бесперебойная работа. Электроэнергия поставляется бесперебойно: ЦОД четвертого уровня Tier4 подключены к двум электростанциям одновременно, для страховки. И даже если случилась авария на линии, в запасе всегда имеются мощные генераторы, которые в любую минуту готовы принять вахту.
  • защита доступа. Всегда находятся третьи лица, которые хотят завладеть той или иной информацией, поэтому принимая на хранение данные, дата-центры обеспечивают ее конфиденциальность.
  • сохранность и целостность. В дата-центрах хранится вся информация: от фото любимого питомца до секретных данных.

Дата-центр: готов к любым испытаниям

Центры обработки данных укомплектованы не только современными серверами, но и надежной противопожарной защитой. Газовые системы используют порошок углекислоты, который способен ликвидировать возгорание, для предотвращения поломки остального оборудования. Особое внимание уделяется обеспечению соответствующего климата.

Серверы и жесткие диски во время использования выделяют тепло. Для охлаждения ПК достаточно кулера со спичечный коробок, для промышленных масштабов этот вариант не подходит. Здесь установлены полноценные системы кондиционирования и вентиляции, которые защищают лабиринты из серверов от перегревания.

Дух коммерции или на чем зарабатывают дата-центры

Крупные компании, такие как Facebook, Google, имеют в своем распоряжении собственные хранилища, но для более скромных потребителей есть услуга аренды места в дата-центре. Это может быть один сервер (dedicated server) или место в стойке (collocation), где можно установить собственный сервер, или место в сетевом хранилище. В случае аренды с установкой собственного оборудования, владельцы дата-центров зарабатывают не только на аренде площади, но и на электроэнергии, т.к. арендаторам продают ее с небольшой накруткой.

Еще один вариант заработка для владельцев ЦОД – сдача лицензионного ПО в аренду. Дата-центры приобретают программное обеспечение и устанавливают их на своих серверах, а после (за определенную плату) сдают их частями в аренду. В последние годы набирает популярность услуга аренды виртуального сервера: части ресурса сервера (VPS – virtual private server).

Где хранится вся информация в интернете: уникальные по своей грандиозности и мощи дата-центры

IBM (США)

Результатом эксперимента известной корпорации стал дата-центр на территории Сиракьюсского университета. Суть задания была в снижении потребляемой электроэнергии в два раза. И в 2009 году им это удалось. Для питания используется отдельная станция, работающая на газу.

Citigroup (Германия)

Центр, разработанный фирмой Arup Associates в 2008 году, считается одним из самых «зеленых» комплексов этой категории. Это значит, что его работа наносит минимальный вред природе. Все от освещения до охлаждения направлено на рациональное использование. О заботе о природе можно догадаться и просто посмотрев на сооружение: один из фронтонов устелен газоном, который украшает здание и собирает воду, используемую в увлажнителях.

Ebay (США)

Дата-центр Ebay построена на песках Аризонской пустыни (не самая простая задача для инженеров, работающих над созданием охладительной системы). Оборудование в этом центре помещается в специальные контейнеры, которые не только смогли защитить их от перегрева, но и повысить собственную энергоэффективность до 95%.

Digital Beijing (Китай)

Пекинский ЦОД выделяется мощью и смелыми архитектурными решениями. Специально к Олимпиаде 2008 года архитектурной компанией Studio Pei-Zhu было построено здание в 11 этажей, которое стало и дата-центром и штабом технической поддержки Олимпийских игр. Теперь, когда спортивные мероприятия завершились, в здании работает музей.

Apple (США)

Яблочная компания заботится не только о бесперебойности и сохранности данных своих клиентов, но и об экологической ситуации на планете. Поэтому одной из основных целей было использование энергии из возобновляемых источников. Работа в дата-центре зависит от 400 тыс.кв.м солнечных батарей. Энергии достаточно для обеспечения 60% работы центра, остальная мощность подается с электростанции (на биотопливе).

Google (Финляндия)

Гигант веб-индустрии имеет, безусловно, не один дата-центр. Комплексы разбросаны по всей планете и практически все они отвечают критерию «green». Для работы над финским ЦОД был приглашен один из лучших финских специалистов — Алвар Аалто. Холодные воды Финского залива идеально подходят для создания соответствующего климата внутри помещений.

Verne Global (Исландия)

Концерн BMW использует этот ЦОД в Рейкьявике для своих нужд: расчет показателей новых моделей, обработка результатов испытаний и другое. За счет работы гидроэлектростанций, установленных вблизи гейзеров, дата-центр не загрязняет окружающую среду углекислым газом.

Facebook (США)

В Праймвиле компания Марка Цукерберга возвела дата-центр площадью 28 тыс.кв.м. Представьте флешку размером как три футбольных поля. Для объединения серверов используется 6,5 тысяч километров оптоволокна, а для охлаждения построен 7-ми комнатный пентхаус с современной системой природного кондиционирования.

Дата-центр: место, где хранится Интернет

Наступает новый день, рабочий или выходной, и, если нечем заняться, то руки тянутся к лежащему на столе любимому ноутбуку…

Персональные компьютеры появились достаточно давно, лет тридцать назад. Использовали их тоже персонально – в одиночку набирали и печатали всякие тексты, писали простые программы (и носили их между персоналками на больших дискетах), играли в «монопользовательские» игры (хотя нет, я помню игрушки, где можно было играть вдвоем, разделив кнопки одной клавиатуры пополам).

Настоящая же революция произошла не с изобретением персоналок, а с появлением возможности соединять их в сеть.

Сначала — в пределах лаборатории, затем — между особо важными военными базами и узлами управления ракетным огнем, потом — и по всему миру: как это редко бывает — сугубо военные разработки стали работать на благо людей, а не для их уничтожения. Разработки сетевого интерфейса фирмой 3COM Бобом Меткалфом и протокола http Тимом Бернерсом-Ли спустя 20 лет позволили нам получить то, без чего представить жизнь современному поколению невозможно: Интернет.

Быстрый и тормознутый, летучий по воздуху и бегущий по проводам, халявный и по неадекватной стоимости, интересный и тупой, безопасный и заразный, полезный и времяубивающий, свежий и столетней давности, настоящий и фильтрованный (ну прямо как пиво!).

И если про пиво мы знаем все: где оно производится, хранится и по какой цене продается — то знаете ли вы так же много об Интернете? Нет? Вы пьете слишком много пива! (шутка).

    Сам Интернет можно разделить на 2 части:

  • собственно контент
  • технические средства его доставки на ваш ноутбук.
  • Какая из них важнее? Сложно сказать, но я полагаю, что первая: именно полезным контентом можно привлечь на сайт пользователей, заработать денег на востребованных онлайн услугах. А доставить все это богатство пользователя – что называется, дело техники — в прямом и переносном смыслах.

    Так поговорим же в этой статье об Интернете, вкладывая в это понятие, прежде всего, его информационное наполнение, т.е. контент.

    Производством контента занимаются все, кто так или иначе генерирует или собирает какую-либо информацию. Даже Вы, написав в Твиттер «хорошо-то как!», тоже становитесь источником информации во вселенной (вопрос только насколько полезным?). Хотя, не будем так практичны, самовыражайтесь в Сети как умеете: она предназначена и для этого тоже.
    Так вот, все сайты, фотографии, записи ваших разговоров по Скайпу (сюрприз!) и прочие данные хранятся на специализированных объектах телекоммуникационной инфраструктуры, называемым дата-центрами или центрами обработки данных (ЦОД).

    ЦОД изнутри.

    Современный дата-центр представляет собой этакий большой банк — место, где под замками надежно хранится информация (в том числе и некоторых банков, хотя они предпочитают строить свои собственные дата-центры — так им спокойнее).
    Все подчинено одной цели: сохранение целостности хранящейся информации, защита от несанкционированного доступа и её доступность 24 часа в сутки и 365 дней в году тому, кому она предназначается. Ценность же хранимой информации может быть различна: от фоток чьей-то собаки и до …

    Особенность в том, что для того, чтобы похить информацию, не надо врываться и кричать «Это ограбление! Информацию сюда — в сумку!»: все происходит незаметно под гул системы кондиционирования. Хотя для предотвращения описанной криминальной сцены имеются все атрибуты банка реального: круглосуточная охрана, видеонаблюдение, системы контроля и доступа, а так же high-tech охранники (очкарики-ботаны, учившиеся в универе на «отлично») — гарантируют, что никто не подменит файл на винчестере или не стащит жесткий диск из чужого сервера.

    Сервер – это специализированный компьютер. Основное внимание при его разработке и производстве делается на надежность как аппаратного (микросхемы) так и программного (серверная операционная система, серверные программы-приложения) обеспечения, высокую производительность и реальную многозадачность. Именно в нем располагаются быстрые жесткие диски с нашим Интернетом на борту.

    Крупный дата-центр потребляет уйму электроэнергии.

    Согласно жестким правилам, которым должны соответствовать дата-центры четвертого уровня (или Tier4, круче не бывает), питание объекта должно осуществляться от двух независимых источников электроэнергии (то есть двух разных электростанций).

    А на всякий пожарный есть еще дизельные генераторы и аккумуляторные батареи (на батарейках дата-центр не проработает долго – они нужны, чтобы продержаться пару минут, пока дизель-генераторы запустятся, выйдут на рабочий режим и подадут ток).

    Пожарному случаю тоже уделено особое внимание: в дата-центрах используется газовое пожаротушение, чтобы в случае чего не повредить во время нештатной ситуации порошком углекислоты (он в традиционных огнетушителях для электроустановок) оставшееся оборудование.

    Третий, не менее важный компонент: системы охлаждения и климат-контроля. В процессе работы серверы и жесткие диски выделяют значительное количество тепла, которое надо куда-то удалять. Охлаждение летом выполняется кондиционерами, по ночам можно и фильтрованным прохладным воздухом, ну а морозным днем зимний воздух смешивается с горячим внутренним (что бы серверы не простудились. шутка). Серверы, в основном, болеют этаким артрозом: изнашиваются подшипники в вентиляторах охлаждения.

    На случай скоропостижной смерти сервера или винчестера используются разные технологии их резервирования. От банального бэкапа информации вашего сайта на другой сервер по расписанию, до так называемого «зеркалирования»: сохранения информации в реальном времени на двух географически разнесенных дата-центрах.

    И еще ЦОД — это очень много проводов и оптического кабеля.

    На чем зарабатывает дата-центр.

    Основная услуга, предоставляемая дата-центрами, это аренда:

    • места на жестком диске или сетевом хранилище под хранение данных (нашего с вами Интернета),
    • места в двухметровой стойке под сервер заказчика (collocation – колокейшн),
    • самого сервера целиком (dedicated server – выделенный сервер)
    • или аренда целого бокса, заставленного стойками, пустыми или заполненными серверами. В последнем случае торгуют не только площадью, но и потребленной серверами клиента электроэнергией (т.е. перепродажа энергии с небольшой накруткой).

    Набирает популярность аренда программного обеспечения (SaaS – software as a service – программное обеспечение как услуга): дата-центр покупает лицензионное программное обеспечение и, установив на мощный сервер, раздает его по частям своим клиентам). А также аренда кусочка ресурсов сервера (VPS – virtual private server – виртуальный сервер).

    Теперь вы знаете, где хранится интернет

    Ах да, интернет можно хранить и у себя дома. Надо купить реальный IP-адрес у провайдера, настроить домашний web-сервер и разместить на нем свой блог.
    Конечно, знаний потребуется больше, и канал доступа в интернет хорошо бы иметь «потолще», фаервол понадёжнее и сервер не выключать круглосуточно. Лучше доверить эти заботы профессионалам из ЦОД: за небольшие деньги коэффициент доступности вашего Интернета для других пользователей резко возрастет.

    А напоследок хочется вспомнить сакраментальное: «Кто владеет информацией, тот владеет миром». Кстати, это, случайно, не девиз компании Гугл? Помните об этом, когда в очередной раз загружаете свои личные документы на какой-нибудь сервер Dropbox’а, расположенный в каком-нибудь ЦОДе…

    UPD: Вот интересная статья о действиях айтишников на случай черезвычайной ситуации с ЦОД. Даже если вы не поймете половины слов, то масштабность и сложность процесса вполне можно оценить

    Жмите кнопки, чтобы поблагодарить автора, улучшить карму и украсить ленту соц.сети.

    Где хранится информация, собранная о нас в интернете и как она используется

    Персональные данные, размещённые в интернете, становятся достоянием общественности, государства, структур или людей, владеющих ресурсом, на котором они размещены. Главные агрегаторы личной информации пользователей всемирной паутины – Google, Amazon, Microsoft, банки, мобильные операторы, интернет-магазины и платёжные системы.

    • Собирают ли о нас информацию в интернете?
    • Как проверить, собирают ли о вас информацию?
    • Google Alerts
    • Как можно использовать сервис Google Alerts?
    • Советы и выводы

    Собирают ли о нас информацию в интернете?

    Информация – оружие XXI века. Крупные компании научились собирать и обрабатывать данные миллионов людей, использовать их в маркетинговых целях, для формирования статистики. Часть конфиденциальной информации интернет-пользователи предоставляют добровольно: банкам, платёжным системам, социальным сетям, транспортным службам, но гораздо большие объёмы собираются «тайно». Почему, например, корпорация Google так сильно разрекламировал свой браузер Chrome?

    Почти всё, известное о вас благодаря интернету, предоставляется через браузер: история поиска, навигации по сети и поведение на сайтах, cookies, банковские транзакции, геометки, IP-адреса, масса различной информации о компьютере. И в большинстве случаев пользователей к этому принуждают. Без галочки под условиями использования интернет-сервиса или приложения вы не сможете работать с ним или останетесь без части функций.

    На мобильном устройстве слежка реализуется еще проще: достаточно установить и запустить приложение, требующее доступа к камере, микрофону, списку контактов, местоположению и т.д. И смартфон превращается в шпиона, особенно при включённом интернете.

    От количества информации у компании зависит объём данных для анализа. Чем её больше, тем мощнее алгоритмы обработки, следственно – выше доход от рекламы. Кроме того информация покупается и продаётся. Даже Facebook уличили в торговле данными пользователей c такими IT-гигантами как Netflix, Apple, Microsoft.

    Как проверить, собирают ли о вас информацию?

    По умолчанию Google собирает о клиентах всё, к чему дотянется: местоположения, история поисковых запросов, открытых веб-страниц, поведения на них, пароли с логинами. И это только через браузер. Спектр получаемой информации на мобильном Android-устройстве гораздо шире. Даже владельцы небольших сайтов и интернет-магазинов пытаются узнать о посетителях максимум. Microsoft и Apple доступно ещё больше сведений.

    Часть хранимой на серверах Google информации можете увидеть по ссылке . Слева в меню располагаются переключатели категорий.

    То же для Youtube .

    История местоположения также доступна, если соответствующая опция включена в браузере и на мобильном устройстве.

    Это верхушка айсберга, его основная часть невидима. Гораздо большие пласты данных хранятся на серверах IT-корпораций без доступа к ним пользователей. Google же позволяет удалить часть данных из пользовательского профиля. Останутся они после этого на сервере или станут недоступными в аккаунте?

    Google Alerts

    Данный сервис представляет собой надстройку над поиском, предназначенную для отслеживания и отправки уведомлений при появлении в сети или указанных сайтах интересующий информации. Параметры оповещений настраиваются:

    • периодичность отправки:
    • источники и тип контента (новости, статьи, книги);
    • страна и язык публикаций;
    • количество результатов.

    Как можно использовать сервис Google Alerts?

    Этот сервис вполне применим для большинства сфер бизнеса. Типичные примеры применения данной платформы:

    1. Отслеживание упоминаний вашего бренда или интернет-ресурса.
    2. Получение сведений об индексации новых публикаций на сайтах.
    3. Поиск плагиата.
    4. Отслеживание новостей и новинок в интересующей области (хобби), местности.
    5. Поиск комментариев с указанным содержимым или спамом.
    6. Шпионаж за конкурентами.
    7. Мониторинг блогов, видеохостингов, локального контента (для бизнеса, работающего в определённом регионе).
    8. Поиск площадок для публичных заявлений и выступлений.
    9. Поиск актуальных скидок, бонусов, специальных предложений.
    10. Оценка контента (на своих ресурсах).
    11. Поиск фриланс-проектов.

    Это основные примеры использования сервиса Google Alerts. При задействовании операторов из поисковой системы Google, комбинирование операторов и значений параметров сферы применения сервиса значительно расширяются.

    Советы и выводы

    Анонимности в интернете нет уже достаточно давно, но лежащие в общем доступе данные, необходимо суметь найти и использовать в собственных целях. Одним из полезных в этом плане инструментов является сервис Google Alert. Он предназначен для уведомления пользователей с профилем в Google о появлении в интернете интересующих их сведений о тех или иных событиях, процессах. Умелая эксплуатация данного сервиса позволяет следить за конкурентами и собственным брендом, оставаться в курсе свежих событий в мире или своём регионе без необходимости рысканья по десяткам различных новостных порталов.

    Способы хранения информации — паролей, сканов документов, фото и прочего — чтобы ничего не терялось и было под рукой

    Все мы храним информацию в электронном виде, но, к сожалению, не все делают это правильно. Её можно хранить на жёстком диске, внешних накопителях (смартфонах, переносных жёстких дисках, флешках, картах памяти, CD и DVD дисках), а также в облачных хранилищах.

    реклама

    Итак, представим, что у нас есть первый компьютер, и мы хотим грамотно организовать хранение нашей информации. Первое, о чём следует позаботиться, это хранение паролей. Поскольку форумы, социальные сети, сетевые игры, электронная почта и Ютуб (если вы хотите сохранять историю просмотров и оставлять комментарии), требуют регистрации. Рассмотрим специальные программы для защиты Ваших паролей, причём они защищают их как от взлома, так и от случайной утери.

    Например, есть приложения для смартфонов вроде программы «Сейф+» и ей подобных, которые надёжно зашифруют ваши логины и пароли. Можно также воспользоваться более простым способом, создать архив с паролем и хранить его на флешке в укромном месте. Пароли нужно хранить как минимум в двух экземплярах!

    Также нам регулярно требуются сканы документов, их лучше хранить также в двух экземплярах, первый на смартфоне, в формате PDF или Jpeg (на карте памяти, на случай поломки смартфона или сдачи его в ремонт). Второй экземпляр на флешке или в облачном хранилище.

    реклама

    Облачные хранилища это прежде всего Google Диск и Яндекс.Диск. В них можно хранить как текстовые файлы, так и фотографии, музыку, видео. Рассмотрим их подробнее.

    Google Диск предоставляет в бесплатное пользование 15 Гб свободного места, если хотите больше, то оформляйте подписку. Не стоит забывать, что компания Гугл (Google) является разработчиком мобильной операционной системы Андроид (Android), и если у Вас на смартфоне стоит одна из его версий, то аккаунт на mail.google.com будет обязательным. Он позволит сохранять в облако записную книжку смартфона и резервные копии приложений типа Ватсап (WhatsApp).

    Внимание! Если ваш ребёнок просит сделать ему канал на Ютубе, чтобы стать блогером, то обязательно создавайте для него новый аккаунт! Поскольку если его неожиданно забанят, то Ваши данные останутся в целости и сохранности. Аналогично если Вы сами пишите много комментариев «о накипевшем», пишите их с «чистого» аккаунта.

    реклама

    Яндекс.Диск может безлимитно загружать фотографии с телефона, и бесплатное место для остальных данных может варьироваться в зависимости от участия в акциях. Например, у меня бесплатный лимит равен 40 Гб, а для новых пользователей доступно только 10Гб.

    Когда вы удаляете файлы в программе Яндекс.Диск, они попадают в «Корзину» и хранятся в ней 30 дней. После этого они автоматически удаляются с сервера. Восстановить удаленные с сервера файлы невозможно! Однако восстановить файлы из «Корзины» вполне возможно, но только в веб-интерфейсе Яндекс.Диска. Если вы хотите удалить файл с компьютера, но сохранить на сервере, настройте выборочную синхронизацию.

    Переносные жёсткие диски, у меня их целых три, рационально использовать для хранения сеймейных фото- и видеоархивов, установочных файлов программ, которые могут пригодиться в любой момент, но занимают много места. Я, например, самый ёмкий жёсткий диск (объёмом на 1Тб) использую для хранения мультиков и детских фильмов.

    реклама

    Также есть сетевые хранилища, которые представляют из себя корпус из пластика или металла, в котором содержатся как минимум пара жёстких дисков и специальная плата с операционной системой. Фактически это автономный компьютер и его можно подключать в локальную или глобальную сеть для получения общего доступа нескольким пользователям. Эти хранилища стоят довольно дорого, но имеют свои преимущества. Например, не нужно бояться, что Вас могут забанить за резкий комментарий под роликом на Ютубе, или что Вы потеряете пароль от вашей учётной записи. Также сетевые диски позволяют создавать Рэйд (RAID) массивы, их существует несколько видов, но наиболее популярный так называемый «зеркальный», в котором вся информация, записываемая на один жесткий диск, автоматически дублируется и на второй.

    В современных ПК зачастую отсутствует DVD привод, но зато обычно есть картридер для чтения карт памяти всевозможных форматов. Поэтому содержимое дисков плавно перекочевало на флешки. Так появились загрузочные USB, с которых можно устанавливать Windows и запускать тестовые утилиты для диагностики жёсткого диска и оперативной памяти, а также можно запустить антивирус для лечения ПК от вирусов. Кстати, среди утилит зачастую есть и программа для сброса забытого пароля у операционной системы, я сам ей пользовался ещё будучи студентом, когда младшая сестра установила пароль на компьютере и благополучно его забыла.

    Для самых ленивых есть даже образы дисков с операционной системой и основными программами, включая полный комплект Майкрософт Офиса (Microsoft Office), но тут стоит учитывать, что это пиратские версии программ и они работают не всегда корректно.

    Очень полезная вещь – портативные (portable) версии программ, которые можно запускать с флешки и при желании переносить на ПК обычным копированием. Так меня часто выручает portable версия браузера Мозилла Фаерфокс (Mozilla Firefox), которая позволяет мне пользоваться браузером со всеми вкладками и закладками на любом компьютере, с любой версией Виндовс.

    Вторая по полезности portable программа – почтовое приложение Мозилла Тандебёрд (Mozilla Thunderbird), позволяющая работать с почтой сразу из нескольких почтовых ящиков. У меня она долгое время была на флешке и получала почту сразу с шести е-мейлов нажатием одной кнопки! Если Вы торговый представитель или юрист, то возможность носить на флешке всю вашу почту поможет сэкономить уйму времени.

    Для любителей различных заметок и стикеров на рабочем столе компьютера есть бесплатная программа Google Keep. Она полностью бесплатна, и единственный минус — отсутствие версии для Windows, но у неё есть веб-версия (которую можно использовать в портативной версии Mozilla Firefox) и расширение для браузера Хром (Chrome). Для смартфонов и планшетов она доступна на Android, iOS.

    И напоследок небольшой совет для меломанов, у которых есть редкие музыкальные CD диски. Если Вы хотите перенести свою музыку на ПК, то самый простой вариант – найти эту музыку в Интернете. Зачастую она будет доступна на различных сайтах (где за просмотр рекламы можно слушать музыку), в разном качестве звучания. Если её в глобальной сети нет, то отчаиваться не стоит, есть программы, называемые аудио-грабберы (Audiograbber), способные переносить музыкальные треки на жёсткий диск ПК. Кстати копировать музыку с аудио дисков умеет стандартный медиаплеер в Windows XP.

    Как долго хранится информация о человеке в сети?

    Долго ли хранится в сети информация о человеке или сайте ?

    Любой пользователь персонального компьютера, хоть раз зарегистрировавшийся на любом сайте, так или иначе задался вопросом: а долго ли хранится информация о человеке в сети? Достаточно ли просто удалить страничку, стереть личные данные и забыться? Такой вопрос становится особенно насущным для тех, кому, продвигаясь по карьерной лестнице, стала предъявлять требования корпоративная этика.

    Для тех, кто уже немного стесняется бурного прошлого, у меня нехорошие вести. Тем, кто только начинает свою сетевую деятельность, посоветую прислушаться: не стоит делать того, о чём, возможно, пожалеете. По крайней мере, под настоящим именем.

    Потому что информация о человеке в интернете хранится вечно.

    Сейчас я вам объясню, каким путём можно пойти, чтобы попасть в прошлое и настоящее, где все ещё молоды, безрассудны и немного наивны.

    Интернет обладает возможностью вернуть прошлые годы, и глобальная сеть представляет собой настоящую машину времени, которую можно запустить с помощью нехитрых сервисов, без специальных навыков владения командами и сложными операндами поисковых систем.

    Любая информация о человеке или сайте с момента появления оных хранится на серверах поисковых систем. И не только в них. Да и одних только поисковиков по всей сети наберётся десятка два – немало, правда. Среди них есть старожилы, возраст которых превышает возраст некоторых современных активных пользователей сети.

    Это значит, как только поисковой робот обнаружил (проиндексировал) ваше появление, вы уже навечно остались в сетевой памяти. Причём некоторые интернет-сервисы могут напомнить вам пошагово, что появлялось на вашей страничке, что изменялось, а что вами стёрто. Будь это информация о человеке или веб-ресурсе, не важно.

    Хватит лирики, переходим к делу.

    Самый большой сетевой справочник и помощник «следователя» – это, конечно, поисковые системы. Для России самыми популярными из них являются Яндекс и Google. Яндекс наиболее популярен на просторах бывшего СССР, Google – просто самый популярный в мире. Есть и другие. И живут они за счёт того, что собирают любую уникальную информацию, которую мы нарочито или не специально выкладываем в сеть. Всё, эта информация уже серверы поисковика не покинет. Хотите вы этого или нет.

    По объёму индексирования (читай – по объёму хранящейся о нас информации) пальму первенства удерживает Google. C ней и будем работать.

    «Но я не пользуюсь Google, я ищу в Яндексе!». Да неважно )) Вас, как в мультфильме про козлёнка, который умел считать, уже запомнили. Вот как эту информацию выудить…

    Перед тем, как приступить к работе, вооружитесь специальным инструментом: браузер Tor. Он позволит вам анонимно гулять по сети и получать информацию со всех ресурсов, запрещённых в тех или иных странах.

    Шаг первый. Операнды в поисковых системах.

    Goggle помнит всё. Яндекс тоже помнит многое. Как и для браузера, в котором вы путешествуете по сети, так и для поисковика есть понятие кэша. Кэш (от англ. cache – тайник), та часть памяти, которая позволяет хранить данные, что, возможно, ещё понадобятся. В компьютере, в браузере, в Google. В полиции.

    Как найти сайт, которого нет? Как посмотреть на него в том виде, каком он был месяц, год назад? Когда только появился?

    Возможно, самая простая из задач.

    Кэш Google доступен и вам. Вот что говорит об этом способе сам Google: про кэш Google. Откройте поисковик Google и наберите в строке адреса:

    http://www.google.com/search?q=cache:адрес-интересующего-сайта

    Адрес лучше указывать полным, с http://. Трюк сработает, если Google успел заметить этот сайт. Или автор специально не подготовился и не запретил кэшировать страницы поисковым роботам. Например, через файл robots.txt.

    Другое дело, если сайт на плаву, но страницы сайта удалены. Кэш Google отлично выручит вас. Вот, что выдал Google по запросу на мой блог:

    Это снимок главной страницы сайта – той, что я попросил Google. Google всегда покажет последнюю версию кэша, и если сайт рабочий, она, эта версия, будет датирована не самым давним числом.

    Переход же по ссылкам кэша сайта вас огорчит – они уведут в никуда (если страницы нет, так что поиском в прошлом кэш умеет пользоваться лишь ограниченно); если вам же известна конкретная страница сайта, смело используйте её после указанного адреса https://www.google.com/search?q=cache: и кэш Google отобразит страницу, которой нет. Вам может повезти.

    Шаг второй. Специальные ресурсы.

    Познакомлю с сайтами, коими пользуюсь сам. Это инструменты куда серьёзнее. Нашего внимания достойны:

    CachedPages.com

    (она использует сразу несколько сервисов, в том числе и второй, мною указанный ниже).

    web.archive.org

    Конкретно по трудностям, с которыми можно столкнуться.

    • Скорее всего, эти сайты в России заблокированы. Tor вам в помощь.
    • Скрипты социальных сетей (а копать чаще можно именно там), ведут теперь обычно в одно и то же место – на страницу регистрации. Она не имеет срока давности. Однако в некоторых случаях вам может повезти, если копнуть подальше.

    Запустим Tor и заглянем, например, в прошлое одно из самых знаменитых сайтов знакомств mamba.ru. Заходим на web.archive.org и введём знакомый многим адрес:

    нажимаем Enter, видим вот это:

    Ресурс на буржуинском, однако всё интуитивно понятно. Стрелка 1 показывает, сколько сайт кэшировался раз в течение срока существования, а под цифрой 2 я указал дату появления этого сайта знакомств. Информация по сайту и появляющихся изменениях представлена в виде календаря. Окно интерактивно и вы можете не спеша “прогуляться” по старым страницам сайта, щёлкая по столбцам с годами или конкретным дням. Дальше сами Не зацикливайтесь только на указанном ресурсе, попробуйте и другие.

    Эта информация будет полезна, скорее, тем, кто ищет авторов и участников конкретных ресурсов в сети. Если вас интересует информация о человеке , о котором вы уже что-то знаете, вам сюда.

    Теперь информация о человеке .

    Всё зависит от причин, по каким из них вы хотите его найти. Человек может быть вам только что представлен, вы знакомы с ним вживую и хотите узнать о нём больше. Тогда лучше социальных сетей и ресурсов государственных органов (штрафы, выигранные патенты, судебные решения) вам не найти. Однако, чтобы не тратить времени даром и не просто вбивать в строку поиска имя и фамилию, воспользуемся специальными операторами Google и Яндекс.

    Напомню, что среди поисковых систем, наиболее обширной базой является Google. И операторы Google нам в помощь. Для начала откройте в браузере поисковую систему Google и вбейте имя жертвы, но в таком формате:

    intext:иван сидоров

    оператор intext заставит искать сочетание иван сидоров по всем сайтам, где встречается или встречалось это словосочетание. В поисковой выдаче сверху вниз пойдут самые ранжируемые сайты. Но…

    Вся прелесть операторов Google заключается в том, что чем больше мы знаем о человеке, тем больше мы можем сузить район поиска человека. То есть операторами мы можем продолжить поиск, отсеивая или, наоборот, включая параметры поиска. Например, после команды intext:иван сидоров можно добавлять команду “-” (отсеять). Например, наш Иван Сидоров после поверхностной проверки точно не Дмитриевич. Значит, не выходя из страницы поисковой выдачи добавим оператор “-” с просьбой не учитывать Дмитриевичей:

    Все результаты с ненужным человеком исчезнут. По мере отсева самых заядлых участников-однофамильцев интернет сообщества можно полностью исключить, минусуя (без пробела) их “характеристики”. Учтите, опять же, что множественные запросы Google встретит проверкой капчей, так что советую подготовить список исключений сразу.