「事象の地平線」過去ログ倉庫
過去ログなので閲覧のみです。コメントとトラックバックの投稿はできません。徐々に整理して、Geeklogに移す予定です。
Calendar
Pageview
Profile
過去ログ倉庫です。
コメントもトラックバックも受け付けていません。コメント無しにした状態でページを動的に出すと、既に投稿済みのコメントまで表示されなくなるため、静的に表示させています。このため、コメント入力のフィールドが出ていますが、POSTボタンは無効なので、ご注意ください。
コメントもトラックバックも受け付けていません。コメント無しにした状態でページを動的に出すと、既に投稿済みのコメントまで表示されなくなるため、静的に表示させています。このため、コメント入力のフィールドが出ていますが、POSTボタンは無効なので、ご注意ください。
Menu
Pickup Photo!
All Photos & All Maps
All Maps
Random Photo!
Recent Entries
【業務連絡】当面コメントを承認制にします(06/05 15:08)
こんな疑似科学は嫌だ(06/04 23:42)
教科書レベルの記述(06/04 01:29)
シャープペンの芯についてのメモ(05/31 13:03)
人を切り離さないことによるメリットを知りたい(05/29 19:46)
理科実験(?)ネタ本(05/27 23:41)
パスを探してくれてない?(05/23 20:13)
赤福餅入手(05/23 17:12)
冷凍冷蔵庫欲しい……(05/19 01:27)
おうちをBフレッツにした件(05/17 21:34)
実は水伝はニセ科学以外の部分が多いのではないか(05/16 01:39)
暖をとる(笑)(05/15 01:20)
いくつかメモしておく(05/13 19:26)
Der Schwarm(05/12 12:58)
日本語の問題というよりは……(05/11 17:20)
ditto直接実行の方が良さそう(05/07 19:11)
【業務連絡】時々サーバを止めるかもしれません(04/30 03:14)
講義wiki更新とか(05/02 18:16)
昨日は論で書いたので……(05/01 23:55)
ゼミとかファイルとか(04/29 12:56)
Recent Comments
Categories
Archives
Pageview Ranking
Cool Ranking
Rate Ranking
default_main (0)
Search
2008/03/01
何故検索できたのか?
【修正】
お茶大の方の掲示板に書いてるのだが、一応こちらでも書いておく。
仮の名をAさんとする(メールアドレスa@abc.jpとする)から、メールアドレスがウェブサーバで公開されているというクレームがあった。Yahooで検索するとatom11.phys.ocha.ac.jpが引っ掛かる、という連絡であった。
全く覚えのないアドレスであったので、不思議に思いつつ検索してみたら、確かにatom11.phys.ocha.ac.jp内のsearch_200411.htmlとsearch_200510.htmlなるファイルが引っ掛かった。search_200411.htmlの中にはa@abc.jpが存在しなかったが、search_200510.html中を見るとa@abc.jpが書かれている。
serach何チャラとうファイルは、httpdのログからwebalizerが自動で生成する、サーチエンジンの検索キーワードをまとめたファイルである。ここに検索キーワードとしてa@abc.jpが登録されるということは、2005年の10月に、どこかの誰かがa@abc.jpと入れてYahoo!なりGoogleなりで検索し、その結果atom11.phys.ocha.ac.jpのどれかのファイルが検索結果に出たので、リンクをつついて見に来たのがhttpdのログに残った、ということではないか。すると、2005年の10月以前に、サイトのどこかにa@abc.jpなる文字列が含まれたファイルが無ければいけないはずである。ところが、これまでにatom11.phys.ocha.ac.jp内にa@abc.jpが含まれたファイルはsearch_200510.html以外に存在していなかった。
ということで、最初の1回目の検索をa@abc.jpというキーワードでやって、なぜatom11.phys.ocha.ac.jpに到達し、apacheのログにそれが残ったのかがさっぱりわからない。さらに、a@abc.jpが含まれていないファイルがなぜヒットするのかもわからない。
一応、キーワードファイルを出した後で、sedで@の含まれている行を全部消すという対応をしたが、何でまたファイル内に存在しないメールアドレスで検索でき、それがログに残るのかがが謎である。
【追記】
向こうの掲示板で(ぱ)さんが指摘して下さったのだが、今回はこういう状況ではないかと。
1)たまたま、メールアドレスの@の両側の「a」「abc」が、同じ月のうちに全く独立に検索され、ばらばらの状態でsearch_200411.htmlに記録された(2004年11月)
2)2005年10月に、誰かが「a@abc.jp」で検索し、search_200411.htmlに到達した。このこため、「a@abc.jp」がsearch_200510.htmlに記録された。
3)webalizerの集計ファイルは一定期間(1年くらい)は、リンクをたどって到達できる。この期間に、サーチエンジンが見に来て登録した。
2)をやったのが全く別の人なら不幸な偶然だが、もし本人だったらある意味自業自得ということになる。
仮の名をAさんとする(メールアドレスa@abc.jpとする)から、メールアドレスがウェブサーバで公開されているというクレームがあった。Yahooで検索するとatom11.phys.ocha.ac.jpが引っ掛かる、という連絡であった。
全く覚えのないアドレスであったので、不思議に思いつつ検索してみたら、確かにatom11.phys.ocha.ac.jp内のsearch_200411.htmlとsearch_200510.htmlなるファイルが引っ掛かった。search_200411.htmlの中にはa@abc.jpが存在しなかったが、search_200510.html中を見るとa@abc.jpが書かれている。
serach何チャラとうファイルは、httpdのログからwebalizerが自動で生成する、サーチエンジンの検索キーワードをまとめたファイルである。ここに検索キーワードとしてa@abc.jpが登録されるということは、2005年の10月に、どこかの誰かがa@abc.jpと入れてYahoo!なりGoogleなりで検索し、その結果atom11.phys.ocha.ac.jpのどれかのファイルが検索結果に出たので、リンクをつついて見に来たのがhttpdのログに残った、ということではないか。すると、2005年の10月以前に、サイトのどこかにa@abc.jpなる文字列が含まれたファイルが無ければいけないはずである。ところが、これまでにatom11.phys.ocha.ac.jp内にa@abc.jpが含まれたファイルはsearch_200510.html以外に存在していなかった。
ということで、最初の1回目の検索をa@abc.jpというキーワードでやって、なぜatom11.phys.ocha.ac.jpに到達し、apacheのログにそれが残ったのかがさっぱりわからない。さらに、a@abc.jpが含まれていないファイルがなぜヒットするのかもわからない。
一応、キーワードファイルを出した後で、sedで@の含まれている行を全部消すという対応をしたが、何でまたファイル内に存在しないメールアドレスで検索でき、それがログに残るのかがが謎である。
【追記】
向こうの掲示板で(ぱ)さんが指摘して下さったのだが、今回はこういう状況ではないかと。
1)たまたま、メールアドレスの@の両側の「a」「abc」が、同じ月のうちに全く独立に検索され、ばらばらの状態でsearch_200411.htmlに記録された(2004年11月)
2)2005年10月に、誰かが「a@abc.jp」で検索し、search_200411.htmlに到達した。このこため、「a@abc.jp」がsearch_200510.htmlに記録された。
3)webalizerの集計ファイルは一定期間(1年くらい)は、リンクをたどって到達できる。この期間に、サーチエンジンが見に来て登録した。
2)をやったのが全く別の人なら不幸な偶然だが、もし本人だったらある意味自業自得ということになる。
カテゴリー:ネット関係の事件など
タグ:
0 cool
posted at 2008/03/01 22:02:46
lastupdate at 2008/03/03 10:46:44
Trackback URL