birdwatcher: (Default)
[personal profile] birdwatcher
А вот, кто в компьютерах разбирается? Вопрос. Допустим, я создаю у себя на веб-сервере каталог, кладу туда файло, и посылаю другу е-мейлом ссылку, чтобы он мог скачать. Это файло (и каталог) гуглом и другими поисковиками проиндексировано не будет, потому что из большого интернета на него ссылок нет.

А если друг читает почту гугл-мейлом?..

Date: 2005-12-19 08:38 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
(Параноидально) Они BCЁ индексируют!

ИМХО официально заявлено, что Гугль индексирует почту, и использует эти индексы для генерации контекстной рекламы. В открытый доступ он эти индексы, естественно, не положит (если не предполагать злонамеренности или раздолбайства). Но он вполне может сгенерить по ним "обезличенную" статистику, и использовать её где попало. Не будет удивительно, если в эту обезличенную статистику попадёт список URLов, а потом кто-нибудь скормит её поисковому роботу.

Насколько секретно то, что вы прячете, и допустим ли такой риск -- решать вам.

Date: 2005-12-19 09:01 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Пора, короче, переходить на федэкс. Цифровая связь окончательно превратилась в цифровую фотографию, только в одном случае никак не сохранить, а в другом - никак не стереть.

Date: 2005-12-19 09:03 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Шифровать надо...

Date: 2005-12-19 09:09 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Значит, неспециалисту послать ничего нельзя, а со специалистом и исходной проблемы с гуглом можно избежать...

Date: 2005-12-19 09:11 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Да, с неспециалистами проблема... :-(

Date: 2005-12-20 03:53 pm (UTC)
From: [identity profile] green-fr.livejournal.com
Просто слать URL в нечитаемом для роботов виде. Как мой мейл - мой ник в ЖЖ на яхуком.

Для индексации не обязательно владеть почтовым сервером. Достаточно владеть сервером, через который рутится почта - она в стандарте ведь не шифруется.

Date: 2005-12-20 06:08 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Вот, кстати, ценная идея. http колон слэш слэш myserver точка com.

Я понимаю, что может и сниффер проиндексировать; но есть какая-то разница между "может" и "точно сделает прямо в гугл".

Теперь уже может.

Date: 2005-12-21 04:19 am (UTC)
From: [identity profile] ex-neo-is-fl156.livejournal.com
Действительно ценная идея. Спасибо, уже добавил в новую версию моего intelligent-spider'а ;)

Date: 2005-12-21 04:22 am (UTC)
From: [identity profile] ex-neo-is-fl156.livejournal.com
В данном конкретном случае я пошутил :)
Но вообще (как параноик параноику скажу) это вполне реально. Я как-то подумал, что хороший способ проверить, сильный ли пароль, т.е. не является ли он словом из словаря, - это скормить его поисковику, и посмотреть равно ли нулю число результатов. Но в тот самый момент, когда Вы делаете эту проверку, Ваш пароль добавляется в словарь (в список запросов)...

Date: 2005-12-19 09:11 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Кстати, формально это на вопрос не отвечает: индексируется только сама почта, или все документы, достижимые начиная со ссылок в почте?

Date: 2005-12-19 09:28 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Если человек делает искалку -- его будет тянуть скармливать искалке всё, что попадёт под руку. Если человек делает почту -- он хоть сколько-нибудь да подумает о её приватности. Остаётся понять, как поведёт себя человек, делающий то и другое. :-)

Мне кажется, что гугловский робот-индексатор (тот, что делает базу данных для искалки) ходит только по "открытым" документам. Этого ему вполне хватает, а обвинений в шпионаже гуглю совершенно не нужно. То есть, непосредственно к почте индексатор не допустят. Но внутри себя Гугль индексирует всё, и случайные утечки вполне возможны.

В принципе, вполне возможно, что кто-нибудь когда-нибудь решит проверить гугль: отправит письмо с URL и проследит, не придёт ли индексатор. А если придёт -- поднимет шум.

Date: 2005-12-19 09:32 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
После того, что [livejournal.com profile] fentucci ниже рассказал, уже никто ни в чем не виноват.

Date: 2005-12-19 09:46 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Отвечено там.

Date: 2005-12-19 09:48 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Так ведь все равно никто не виноват. Кто-то где-то случайно на секунду случайно выложил логи, и сразу убрал. Ищи ветра в поле.

Date: 2005-12-19 09:51 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Именно. Всех мест, где оно может утечь, мы всё равно не знаем.

Date: 2005-12-19 11:55 pm (UTC)
From: [identity profile] glocka.livejournal.com
Да и не надо знать: где-то читал, что в Штатах все, у кого есть доступ к электронной корреспонденции в любом формате на всех промежуточных носителях, после истечения 3 месяцев не могут быть привлечены к ответственности за сам факт выплескивания этой информации в открытый доступ. Поэтому, наверно, надо все подробно прописывать в договорах найма, чтобы компании за подставившего ее работника не пришлось отдуваться.

Date: 2005-12-20 12:09 am (UTC)
From: [identity profile] p_govorun.livejournal.com
Не спасут договора. Если уж люди теряют секретные ноутбуки (всё время сообщения об этом пробегают), то "случайно потерять" диск с данными можно вовсе запросто. И как потом доказывать, что работник что-то нарушил? Притом, что искренних разгильдяев тоже полно, и на их фоне работник ничем не выделяется.

(Про закон о трёх месяцах ничего не слышал.)

Date: 2005-12-19 10:29 pm (UTC)
From: [identity profile] syarzhuk.livejournal.com
Не совсем. То, что он почту читает, на ходу анализирует и подсовывает подходящую рекламу - это факт. Но он (хотелось бы надеяться) её не индексирует (т.е. складывает в своей базе так, чтобы запросы других находили ваши письма)

Date: 2005-12-19 10:34 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Он её складывает в отдельной базе. А потом с этой базой работают рекламщики (будь то люди или роботы). И они вполне могут эту информацию упустить (рекламщиков обычно секретность не волнует).