birdwatcher: (Default)
[personal profile] birdwatcher
А вот, кто в компьютерах разбирается? Вопрос. Допустим, я создаю у себя на веб-сервере каталог, кладу туда файло, и посылаю другу е-мейлом ссылку, чтобы он мог скачать. Это файло (и каталог) гуглом и другими поисковиками проиндексировано не будет, потому что из большого интернета на него ссылок нет.

А если друг читает почту гугл-мейлом?..

Date: 2005-12-19 05:58 pm (UTC)
From: [identity profile] dohlaja-sova.livejournal.com
думаю, если сделать robots.txt, запрещающий соответствующий робот, то в любом случае не будет индексироваться.
а вообще, это из серии "если у вас нет паранойи, то это еще не значит, что ОНИ ЗА ВАМИ НЕ СЛЕДЯТ"

Date: 2005-12-19 06:05 pm (UTC)
From: [identity profile] faceless-lady.livejournal.com
утверждать не стану...но, полагаю, запросто...по-моему, все эти дармовые сервисы должны обслуживать потихоньку идею data mining..."Digital Fortress" всё того же Брауна читали? то есть, книжка-то фиговая, но в ней чётко сказано, что интернет прозрачен для служб. Windows используете? значит, и так у вас никаких секретов.
Другое дело, что формально этого нет, и , значит, поисковики конфиденциальную инфу отражать не должны....иначе, их можно засудить (теоретически).

Ну, это так...всё общие рассуждения.

Date: 2005-12-19 06:16 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Ну уж, windows у меня за пределами локальной сети не виден.

Date: 2005-12-19 06:17 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Просто внезапно подумал, рассматривая access.log - раньше в таких случаях городить robots.txt не приходилось.

Date: 2005-12-19 06:27 pm (UTC)
From: [identity profile] yakovis.livejournal.com
Это забавно, но странно, пожалуй, что вы задумались об этом только в связи с gmail. Есть и другие поисковики, сцепленные с почтой. Яндекс, к примеру. Впрочем, если у вас все по-английски, то Яндекс вам не помеха, а Yahoo все-таки поиск раньше всегда у партнеров покупал, так что такое взаимодействие менее вероятно...

Date: 2005-12-19 08:20 pm (UTC)
From: [identity profile] syarzhuk.livejournal.com
Не могу поверить, что у "don't do evil" Гугла нет дочерней компании, занимающейся только индексацией того, ссылку на что заботливо размещают вебмастеры в файлах robots.txt

Date: 2005-12-19 08:38 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
(Параноидально) Они BCЁ индексируют!

ИМХО официально заявлено, что Гугль индексирует почту, и использует эти индексы для генерации контекстной рекламы. В открытый доступ он эти индексы, естественно, не положит (если не предполагать злонамеренности или раздолбайства). Но он вполне может сгенерить по ним "обезличенную" статистику, и использовать её где попало. Не будет удивительно, если в эту обезличенную статистику попадёт список URLов, а потом кто-нибудь скормит её поисковому роботу.

Насколько секретно то, что вы прячете, и допустим ли такой риск -- решать вам.

Date: 2005-12-19 08:42 pm (UTC)
From: [identity profile] dohlaja-sova.livejournal.com
это было бы логично, разумеется.
но по логам вроде не видать.

Date: 2005-12-19 09:01 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Пора, короче, переходить на федэкс. Цифровая связь окончательно превратилась в цифровую фотографию, только в одном случае никак не сохранить, а в другом - никак не стереть.

Date: 2005-12-19 09:03 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Шифровать надо...

Date: 2005-12-19 09:09 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Значит, неспециалисту послать ничего нельзя, а со специалистом и исходной проблемы с гуглом можно избежать...

Date: 2005-12-19 09:11 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Кстати, формально это на вопрос не отвечает: индексируется только сама почта, или все документы, достижимые начиная со ссылок в почте?

Date: 2005-12-19 09:11 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Да, с неспециалистами проблема... :-(

acess logs...

Date: 2005-12-19 09:16 pm (UTC)
From: [identity profile] fentucci.livejournal.com
Я замечал в логах обращения поисковиков к документам которые я точно никому не показывал и адреса которых никуда не посылал. Единственное, что приходит в голову - это что где-то на какой-то прокси было записано обращение и адрес продан поисковику.

Re: acess logs...

Date: 2005-12-19 09:24 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Тоже неплохо.

Date: 2005-12-19 09:28 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Если человек делает искалку -- его будет тянуть скармливать искалке всё, что попадёт под руку. Если человек делает почту -- он хоть сколько-нибудь да подумает о её приватности. Остаётся понять, как поведёт себя человек, делающий то и другое. :-)

Мне кажется, что гугловский робот-индексатор (тот, что делает базу данных для искалки) ходит только по "открытым" документам. Этого ему вполне хватает, а обвинений в шпионаже гуглю совершенно не нужно. То есть, непосредственно к почте индексатор не допустят. Но внутри себя Гугль индексирует всё, и случайные утечки вполне возможны.

В принципе, вполне возможно, что кто-нибудь когда-нибудь решит проверить гугль: отправит письмо с URL и проследит, не придёт ли индексатор. А если придёт -- поднимет шум.

Date: 2005-12-19 09:32 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
После того, что [livejournal.com profile] fentucci ниже рассказал, уже никто ни в чем не виноват.

Re: acess logs...

Date: 2005-12-19 09:45 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Вряд ли поисковики скупают адреса. У них, скорее, обратная задача -- избавиться от мусора и спама.

ИМХО в вашем случае какая-то случайность. Ну, например, администратор выложил в открытый доступ логи сервера (или прокси-сервера). Такое бывает, особенно если сервер "общественный".

Date: 2005-12-19 09:46 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Отвечено там.

Date: 2005-12-19 09:48 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Так ведь все равно никто не виноват. Кто-то где-то случайно на секунду случайно выложил логи, и сразу убрал. Ищи ветра в поле.

Date: 2005-12-19 09:51 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Именно. Всех мест, где оно может утечь, мы всё равно не знаем.

Re: acess logs...

Date: 2005-12-19 10:28 pm (UTC)
From: [identity profile] syarzhuk.livejournal.com
Бывало, и не раз

Date: 2005-12-19 10:29 pm (UTC)
From: [identity profile] syarzhuk.livejournal.com
Не совсем. То, что он почту читает, на ходу анализирует и подсовывает подходящую рекламу - это факт. Но он (хотелось бы надеяться) её не индексирует (т.е. складывает в своей базе так, чтобы запросы других находили ваши письма)

Re: acess logs...

Date: 2005-12-19 10:31 pm (UTC)
From: [identity profile] fentucci.livejournal.com
Да, возможно. Хотя этот сервер я сам администрирую и уверен что никогда никакие логи не выкладывал. Прокси, с другой стороны... Впрочем это всё равно не так плохо как поиск адресов в почтовых сообщениях.

Date: 2005-12-19 10:34 pm (UTC)
From: [identity profile] p_govorun.livejournal.com
Он её складывает в отдельной базе. А потом с этой базой работают рекламщики (будь то люди или роботы). И они вполне могут эту информацию упустить (рекламщиков обычно секретность не волнует).

Date: 2005-12-19 11:37 pm (UTC)
From: [identity profile] glocka.livejournal.com
Все остальное, наверное, антишпиёнами и антивирусами скачивается, если крестик в настройках возле "раздели ношу с ближним" стоит.

Date: 2005-12-19 11:37 pm (UTC)

Date: 2005-12-19 11:55 pm (UTC)
From: [identity profile] glocka.livejournal.com
Да и не надо знать: где-то читал, что в Штатах все, у кого есть доступ к электронной корреспонденции в любом формате на всех промежуточных носителях, после истечения 3 месяцев не могут быть привлечены к ответственности за сам факт выплескивания этой информации в открытый доступ. Поэтому, наверно, надо все подробно прописывать в договорах найма, чтобы компании за подставившего ее работника не пришлось отдуваться.

Date: 2005-12-20 12:02 am (UTC)
From: [identity profile] glocka.livejournal.com
Странно, что anonymizer.com поисковики и рекламщики еще не скупили и не закрыли. Может, он из неприкасаемых?

Date: 2005-12-20 12:09 am (UTC)
From: [identity profile] p_govorun.livejournal.com
Не спасут договора. Если уж люди теряют секретные ноутбуки (всё время сообщения об этом пробегают), то "случайно потерять" диск с данными можно вовсе запросто. И как потом доказывать, что работник что-то нарушил? Притом, что искренних разгильдяев тоже полно, и на их фоне работник ничем не выделяется.

(Про закон о трёх месяцах ничего не слышал.)

Date: 2005-12-20 03:53 pm (UTC)
From: [identity profile] green-fr.livejournal.com
Просто слать URL в нечитаемом для роботов виде. Как мой мейл - мой ник в ЖЖ на яхуком.

Для индексации не обязательно владеть почтовым сервером. Достаточно владеть сервером, через который рутится почта - она в стандарте ведь не шифруется.

Date: 2005-12-20 06:08 pm (UTC)
From: [identity profile] birdwatcher.livejournal.com
Вот, кстати, ценная идея. http колон слэш слэш myserver точка com.

Я понимаю, что может и сниффер проиндексировать; но есть какая-то разница между "может" и "точно сделает прямо в гугл".

Теперь уже может.

Date: 2005-12-21 04:19 am (UTC)
From: [identity profile] ex-neo-is-fl156.livejournal.com
Действительно ценная идея. Спасибо, уже добавил в новую версию моего intelligent-spider'а ;)

Date: 2005-12-21 04:22 am (UTC)
From: [identity profile] ex-neo-is-fl156.livejournal.com
В данном конкретном случае я пошутил :)
Но вообще (как параноик параноику скажу) это вполне реально. Я как-то подумал, что хороший способ проверить, сильный ли пароль, т.е. не является ли он словом из словаря, - это скормить его поисковику, и посмотреть равно ли нулю число результатов. Но в тот самый момент, когда Вы делаете эту проверку, Ваш пароль добавляется в словарь (в список запросов)...