2ch勢いランキング アーカイブ

Internet Archive総合 (web.archive.org) #2 ©2ch.net


名無しさん@お腹いっぱい。 転載ダメ©2ch.net [ageteoff] 2016/09/30(金) 23:45:13.25
 
 前スレッド

Internet Archive総合 (web.archive.org) #1
ttp://echo.2ch.net/test/read.cgi/esite/1189771222/
 
名無しさん@お腹いっぱい。 [sage] 2016/09/30(金) 23:54:00.45
 
なんだかんだでお世話になってるInternet Archiveについて語りましょう
Internet Archive
ttp://www.archive.org/index.php

インターネット・アーカイブ - Wikipedia
ttp://ja.wikipedia.org/wiki/InternetArchive
  ------------------


Q.Internet Explorerで日本語などの2byte言語のページのWeb Archiveキャッシュを見ようとしても
真っ白なページ&文字化けが起きる&極端に重いなどの症状が出てしまう

A.[表示]もしくは右クリック→[エンコード]→[日本語(自動選択)]やその言語の文字コードに則したものをクリック


Q.Web Archiveでダウンロードしたzipなどが開けない&CRCが違うと表示される

A.よくWeb Archiveは1byte欠けを起こすのでバイナリエディタなどで該当ファイルを開き、
16進数の最後の末尾に「00」を付加すると正常なファイルになることがあります。
 
名無しさん@お腹いっぱい。 [sage] 2016/10/01(土) 00:04:40.17
3!
名無しさん@お腹いっぱい。 [sage] 2016/10/01(土) 00:06:07.00
 
 関連スレッド

ウェブ魚拓 Part2
ttp://echo.2ch.net/test/read.cgi/esite/1340450717/

「ウェブ魚拓」と類似サービス
ttp://echo.2ch.net/test/read.cgi/esite/1440044212/
 
名無しさん@お腹いっぱい。 [sage] 2016/10/01(土) 04:24:53.46
テンプレのQ&A二件、まだそんなやり方が通用すると思ってる奴いるの?
名無しさん@お腹いっぱい。 [] 2016/10/01(土) 15:05:09.01
名無しさん@お腹いっぱい。 [] 2016/10/04(火) 06:16:20.88
浮上
名無しさん@お腹いっぱい。 [] 2016/10/04(火) 15:20:50.65
スレ保全
名無しさん@お腹いっぱい。 [] 2016/10/08(土) 19:41:25.44
これでインフォシークの消えたページ見る方法ないの?
名無しさん@お腹いっぱい。 [] 2016/10/09(日) 06:07:06.45
Internet archiveでYoutubeの動画をダウンロードするのに簡単な方法は何かありますか?
名無しさん@お腹いっぱい。 [sage] 2016/10/09(日) 06:45:07.16

インフォシーク自身はロボット除けの robots.txt を置いたり
コンテンツを Internet Archive からごっそり削除させたりということは
やっていないので、アーカイブさえ残っていれば問題なく見られます。
名無しさん@お腹いっぱい。 [sage] 2016/10/09(日) 15:28:04.62

>コンテンツを Internet Archive からごっそり削除させたり

これどういうこと? 削除なんてできるの?
名無しさん@お腹いっぱい。 [sage] 2016/10/11(火) 00:08:37.65
名無しさん@お腹いっぱい。 [] 2016/10/17(月) 12:49:50.07
Youtubeとかrobots.txtで保存できないサイトは、
Archive.is→ウェブ魚拓と経由させると保存できるよ
これ結構やってる豆知識
名無しさん@お腹いっぱい。 [] 2016/11/30(水) 18:35:43.93
robots.txtで

Disallow: /
Allow: /nullpo/

とかアロウ指定されてても効いてなくて一括ではじかれるやつが痛い
名無しさん@お腹いっぱい。 [sage] 2016/12/01(木) 10:11:29.72

一部のクローラが Allow 文の実装を始める前の、
初期の robots.txt の仕様で動作してるってことだね。
名無しさん@お腹いっぱい。 [sage] 2016/12/01(木) 19:00:58.64
サービス終了したniftyの保存し忘れてたサイトをInternet archiveで
サルベージしようと思ったのに出来るサイトとできないサイトがあるんだな
homepage2.nifty.comはThis URL has been excluded from the Wayback Machine.が出て全くダメで
homepage3.nifty.comはいけた これ2の方はアーカイブされてないってことか
データベース系サイトの消失が勿体無い
名無しさん@お腹いっぱい。 [sage] 2016/12/01(木) 20:20:48.09
あれどういうことなんだろうね
名無しさん@お腹いっぱい。 [sage] 2016/12/09(金) 09:54:15.47
$50の募金?が必要?
1000円ぐらいなら払ってもいいんだけど。
名無しさん@お腹いっぱい。 [sage] 2016/12/12(月) 11:28:39.62
てす
名無しさん@お腹いっぱい。 [sage] 2016/12/13(火) 17:26:17.11
前は500billionページ超えてた気がするけど保存ページへってない?
自分が以前保存させたのも今見てみたら保存できてないし
名無しさん@お腹いっぱい。 [sage] 2016/12/16(金) 20:35:22.16
保守
名無しさん@お腹いっぱい。 [sage] 2016/12/17(土) 04:17:40.90

ttp://web.archive.org/web/20161015012725/archive.org/web/web.php
510 billion web pages saved over time.

これが最高値かな。10 日後には半減してる。
名無しさん@お腹いっぱい。 [sage] 2016/12/17(土) 12:35:53.98
誰も寄付しないの?
名無しさん@お腹いっぱい。 [sage] 2016/12/17(土) 18:40:34.49

Hrm.....
名無しさん@お腹いっぱい。 [sage] 2016/12/22(木) 11:15:51.54
保守
名無しさん@お腹いっぱい。 [sage] 2016/12/23(金) 11:21:56.50
paypalで寄付しようとしたらJPからじゃダメ言われた
名無しさん@お腹いっぱい。 [sage] 2016/12/26(月) 09:15:36.52

だよねえ。運営苦しいのかな
名無しさん@お腹いっぱい。 [] 2016/12/26(月) 23:21:17.03
今Chromeでアクセスして過去ページ見るとどこを見てもファビコンが「あたまにきた」になるんだけど俺だけ?
名無しさん@お腹いっぱい。 [sage] 2016/12/27(火) 04:31:04.60
あたまに?
名無しさん@お腹いっぱい。 [sage] 2017/01/01(日) 00:56:18.70
あけおめ
名無しさん@お腹いっぱい。 [sage] 2017/01/06(金) 12:22:28.80
保守
名無しさん@お腹いっぱい。 [sage] 2017/01/08(日) 13:54:30.34
―――――――――――――――――――――――
名無しさん@お腹いっぱい。 [sage] 2017/01/12(木) 13:54:30.66
―――――――――――――――――――――――
名無しさん@お腹いっぱい。 [sage] 2017/01/12(木) 22:29:14.71
単語で検索できたら最高なのにな
URLが分からなきゃせっかく保存されてる過去の遺産も永遠に見れないままとか糞
名無しさん@お腹いっぱい。 [sage] 2017/01/12(木) 23:37:22.32
昔あったけどやっぱり重すぎたのかな
名無しさん@お腹いっぱい。 [sage] 2017/01/23(月) 03:19:50.01
ここ数日めっちゃ不安定
名無しさん@お腹いっぱい。 [sage] 2017/01/25(水) 14:37:17.64

まあ「more than」ってことで…
名無しさん@お腹いっぱい。 [sage] 2017/01/25(水) 15:27:01.25

わかる
名無しさん@お腹いっぱい。 [sage] 2017/02/06(月) 14:09:30.68
過去にあったURLをキッチリ入れてても観れないサイトってあるんだね。
名無しさん@お腹いっぱい。 [sage] 2017/02/11(土) 23:37:08.87
あちらの時間で9日に取得してアーカイブ成功したときの表示になった62ページのうち
20ちょっとが失敗してることを今確認してて気付いた
使ってた端末とかの環境も取得対象にしたドメインも分散してるからあちらの問題ぽい
そのあたりに取った人は成功してるかチェックしたほうがいいかも
名無しさん@お腹いっぱい。 [sage] 2017/02/12(日) 02:25:00.27
困ったことによくあるんだよなそういうの
名無しさん@お腹いっぱい。 [] 2017/02/12(日) 22:39:45.19
ttp://http://page.freett.com/brave_heart/atm_inspire/
こっちのサイトのFlashを見ようと思って、最近の日時のやつだと表示されないから古い日時のやつ見ようと思ったら勝手にinfoseekのトップに飛ばされてしまう…
飛ばされないようにすることとか出来ぬのか
(ブラウザはedge、chrome、Firefox)
名無しさん@お腹いっぱい。 [sage] 2017/02/12(日) 23:27:33.37
見てみたけどInfoseekトップじゃなくてttp://http://binyudaisuki.hp.infoseek.co.jp/に飛ばそうとしてる(そしてinfoseek側がトップにリダイレクトしてる)。
Flashのことは知らないけど、他サイト(この場合web.archive.org)からの再生を検出してそこに飛ばす、みたいなのが組み込まれてるんじゃないの?
名無しさん@お腹いっぱい。 [sage] 2017/02/17(金) 00:42:15.71
バイナリエディッタって復元したい画像があるんですが、やってくれる神様いますか?
潰れた撮影会系サイトのアーカイブデータなんですが、一連の画像のうち、ほぼ半分が割れて開けません
(わいせつ性もジポ性も皆無のピチピチという言葉にハマらないクソつまらない画像だというのは一連の画像なのでわかります。)
名無しさん@お腹いっぱい。 [sage] 2017/03/25(土) 10:39:36.93
名無しさん@お腹いっぱい。 [] 2017/04/02(日) 01:20:23.71
最近robot.txtで弾かれるの増えたな
ついったの動画とかみんなどうやって補完するんだろう


ここのファビコンはしょっちゅう化ける 原因は不明だが
最近自分が見たサイトのものと入れ替わることが多い
archive自体のファビコンはちゃんとあるのにな
名無しさん@お腹いっぱい。 [sage] 2017/04/15(土) 23:26:54.07
改悪されてそうな悪寒
名無しさん@お腹いっぱい。 [sage] 2017/04/16(日) 00:15:13.22
なんかうまく見れないな
名無しさん@お腹いっぱい。 [sage] 2017/04/16(日) 16:16:35.44
なんかおかしくなってる?
名無しさん@お腹いっぱい。 [sage] 2017/04/16(日) 16:25:47.28
昨日から調子悪くて遺跡発掘が捗らないな
メンテでもやってんのかね
名無しさん@お腹いっぱい。 [sage] 2017/04/16(日) 17:06:19.48
自分だけじゃなくて良かった。
しばらく様子見てみるか。
名無しさん@お腹いっぱい。 [sage] 2017/04/17(月) 02:47:42.58
横にツイッターボタンとかいらんのよ
ちゃんと見れるようにしてくれ
名無しさん@お腹いっぱい。 [sage] 2017/04/17(月) 09:43:38.46
ブクマしてたIAの中の某サイトがきれいさっぱり消滅してた
名無しさん@お腹いっぱい。 [sage] 2017/04/17(月) 11:48:06.13
エエー・・・
名無しさん@お腹いっぱい。 [sage] 2017/04/17(月) 14:46:28.12
自分のサイトが中途半端にアーカイブされていて恥ずかしかったから
なんちゃらtxt入れたら過去の分もアクセスできなくなったがそれじゃないのか
名無しさん@お腹いっぱい。 [sage] 2017/04/17(月) 20:41:16.03
niftyも恥ずかしかったのかな
名無しさん@お腹いっぱい。 [sage] 2017/04/18(火) 22:12:00.90
なんか数日前から突然ツイッターとか他のサイトも色々robot.txtが云々で保存できなくなってて絶望してたんだけど、みんなもそうだったのか
色々なサイトが仕様変更したんじゃなくてInternetArchiveの方が何か改悪したのか?
名無しさん@お腹いっぱい。 [sage] 2017/04/18(火) 22:15:16.02

自分のブクマしてた過去にアーカイブしといたはずのページも見れなくなってた…このままだったら最悪だ
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 00:49:22.33
何で余計な改悪するんだろうな
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 00:57:45.48
顔本ボット仕込んで取得NGにしやがった
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 01:56:45.11
フレームを使用してたページが全て見れないんだけど
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 03:14:21.99
確かに
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 11:06:54.58
firefox10で表示できなくなった。
それとは別に、robots.txtのせいで表示できないサイトがあるのって全体的にそうなの?
名無しさん@お腹いっぱい。 [sage] 2017/04/19(水) 19:42:21.77
Firefox10って?
名無しさん@お腹いっぱい。 [sage] 2017/04/21(金) 00:53:19.35
フレームの件はサイト名がタブに出るから直る可能性があるけど
biglobe系のサイトが全滅?してしまったのが痛すぎる
名無しさん@お腹いっぱい。 [sage] 2017/04/21(金) 04:01:21.62
なんとかアーカイブできるサイトでも表示がすごく変になってる
名無しさん@お腹いっぱい。 [sage] 2017/04/24(月) 03:43:58.99
co.jp/ の表示が co.jp:80/ になってない?
時系列を遡るとURLがおかしくなるな
名無しさん@お腹いっぱい。 [sage] 2017/04/24(月) 07:03:58.24
それは大昔からの仕様
近頃の不具合と一切関係ない
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 09:07:28.13
やはり不具合があるんですね。
保存しようとしたブログが文字化けしてしまう。
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 09:40:01.45
いわゆる機種依存文字だけが化けるという問題なら
2014 年 7 月にすでに始まっているはず。

自称 Shift_JIS の Windows-31J な文書も、あくまで厳密に Shift_JIS として
UTF-8 への変換を掛けてしまってるんだよね。
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 10:43:08.51
そんな前から…
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 13:23:20.20
biglobe系が失われたのは地味にダメージでかいな
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 14:01:22.68
どうやって失われたの?
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 21:37:43.40
フレームのページは見れるようになったが、通常は上に表示される棒グラフが出ないな。
フレームじゃないページでも棒グラフのところが真っ白になるのもある。
名無しさん@お腹いっぱい。 [sage] 2017/04/25(火) 23:20:30.77
棒グラフって一覧表?
名無しさん@お腹いっぱい。 [] 2017/04/26(水) 22:19:13.11

ハーメルンも
名無しさん@お腹いっぱい。 [] 2017/04/27(木) 04:07:25.92

推測だけど、レンタルサーバーに自分のページを作って削除報告→ドメインごと見れなくなるだと思われ
名無しさん@お腹いっぱい。 [sage] 2017/04/27(木) 11:19:11.36
そんな原理が発生しうるのか…
名無しさん@お腹いっぱい。 [] 2017/04/27(木) 13:31:04.19
古いサイトの魚拓をとる場合はGoogleキャッシュ→archive_isが文字化けしないから確実だと思う
名無しさん@お腹いっぱい。 [sage] 2017/04/27(木) 13:49:03.24
IAと違って何年も先の存続にはちょっと不安はある
名無しさん@お腹いっぱい。 [] 2017/04/27(木) 13:57:40.78
IAも誰かが削除依頼すればドメインごと見れなくなるという欠点あるからなぁ
ドメイン(サブ含む)保有者ならrobot.txtを設置するだけで見れなくすることができるし
名無しさん@お腹いっぱい。 [sage] 2017/04/27(木) 14:03:18.05
使い道次第ってことか
名無しさん@お腹いっぱい。 [sage] 2017/04/28(金) 02:26:35.26
IAなら半永久的に残ると思って今まで一生懸命魚拓してきたのがほぼ全滅して虚しい…
名無しさん@お腹いっぱい。 [sage] 2017/04/28(金) 22:16:54.34
最近旧operaだとうまく機能しなくなったからおかしいと思ったら他のブラウザもそうなのか
アドレスが文字化けしたりカレンダー画面出せなくなったり
JS切ると1つだけ検索出てくる(たくさん登録されてても)
システム戻してほしい
名無しさん@お腹いっぱい。 [sage] 2017/04/28(金) 23:23:23.20
(´・ω・`)
名無しさん@お腹いっぱい。 [] 2017/04/30(日) 22:51:56.31
本当に前と比べてかなりのサイトが魚拓できなくなってるし表示もおかしいし今までの魚拓も大部分見れなくなってるしでイライラする
名無しさん@お腹いっぱい。 [] 2017/05/05(金) 10:09:28.44
もうダメだこのサイト使い物にならん…
名無しさん@お腹いっぱい。 [] 2017/05/05(金) 10:23:10.93
Bummer
Hrm
robot.txt
こればっかりで今ネットの9割以上のサイトがこれで全く保存も閲覧もできなくなってる感じなんだけど?
InternetArchiveはネットの保存収集あきらめたの?バカなの?
名無しさん@お腹いっぱい。 [sage] 2017/05/05(金) 14:17:44.03
ブンメルンとハラマはリロードしたら治ることも多い気がする
名無しさん@お腹いっぱい。 [sage] 2017/05/07(日) 19:41:05.12
あるサイト(ジオ)で10あるサイト内リンクのうち6つが「7d6 0」としか表示されないんだけど、
これって何でか分かりますか?
他4つは正常に表示されるんですが……
名無しさん@お腹いっぱい。 [sage] 2017/05/10(水) 16:29:22.43
「HTML はアーカイブされているけど、そこで使われている画像はアーカイブ無し」
という状況のとき、その画像について以前は /save/ の URL にリダイレクトして
オリジナルサーバへ読みに行かせていたのが、ただ 404 を返すだけに変わった。
名無しさん@お腹いっぱい。 [] 2017/05/10(水) 16:47:46.15

Sorry. This URL has been excluded from the Wayback Machine.
これが抜けてる
名無しさん@お腹いっぱい。 [sage] 2017/05/17(水) 18:54:55.38
●の丸マークがぐるぐる回ったまま、ページが開かない
名無しさん@お腹いっぱい。 [sage] 2017/05/18(木) 01:30:13.32
わかる
94 [sage] 2017/05/18(木) 08:40:15.31
え?
もしかしてfirefox10が悪いの?
つい先日まで使えてたのに。
名無しさん@お腹いっぱい。 [sage] 2017/05/18(木) 19:48:20.59
収得ページの上に表示されるグラフやら時間移動の左右矢印やら消えてるのはIA側の不具合ですか?
一番新しい登録から移動できないのは不便。ブラウザ変えてもダメ
名無しさん@お腹いっぱい。 [sage] 2017/05/18(木) 22:07:09.37
Firefox10ってマジ?
名無しさん@お腹いっぱい。 [sage] 2017/05/19(金) 05:37:34.37
古いブラウザでは動作しなくなっていますね。
Firefox 13.0.1 ttp://i.imgur.com/D8ugVF8.png
Firefox 14.0.1 ttp://i.imgur.com/3VhIJse.png
Firefox 21.0 ttp://i.imgur.com/OqutIJD.png
Firefox 22.0 ttp://i.imgur.com/GFL3Imq.png

14.0.1 〜 21.0 ではカレンダーは一応表示されるのですが、
日付が縦に並び、下の月の数字と重なってしまうので使い物になりません。
名無しさん@お腹いっぱい。 [] 2017/05/19(金) 08:08:36.19

そのうち全サイトがrobots.txtかexcludedで見れなくなりそう
名無しさん@お腹いっぱい。 [sage] 2017/05/19(金) 10:20:12.11
よくそんなテスト環境たくさん持ってるなあ
99 [sage] 2017/05/19(金) 10:55:43.46

PortableApps.com のポータブル版ですよ。
Windows XP 自体も仮想環境でして、この仮想マシンを複数用意して
素の Firefox の各バージョンを個別にインストールしたとしても、
レンダリングに関しては有意な差は出ないと思います。
名無しさん@お腹いっぱい。 [sage] 2017/05/19(金) 18:56:40.88
2000だと、まともに使える最終firefoxが10なんだよ。
名無しさん@お腹いっぱい。 [sage] 2017/05/19(金) 23:41:12.51
なるほど2000
しかしどうして2000でInternet Archive
99 [sage] 2017/05/21(日) 11:18:43.39
Windows 2000 SP4 + Opera 12.02 だとカレンダーは出るのですが、
日付が縦一列になってしまいますね。
素の Windows 2000 ではこの辺が限界でしょうか。
ttp://i.imgur.com/QxJpn2k.png

こっちは魔改造版 Windows 2000 (^_^;)
ttp://i.imgur.com/WTJsWcj.png
名無しさん@お腹いっぱい。 [sage] 2017/05/21(日) 19:22:54.61
魔改造すげーなあ
名無しさん@お腹いっぱい。 [sage] 2017/05/29(月) 22:36:35.50
ヤフーのニュース記事とか記録できないんだね
トップ画面に戻される
名無しさん@お腹いっぱい。 [sage] 2017/05/30(火) 07:14:51.77

ttp://echo.2ch.net/test/read.cgi/esite/1189771222/823-834
名無しさん@お腹いっぱい。 [sage] 2017/05/30(火) 08:05:17.69
そんなに前からなんだな
名無しさん@お腹いっぱい。 [] 2017/06/04(日) 05:17:07.49
今まで自分の日記ブログを生きた証としてしこしこ魚拓し続けてきて
たとえサービス終了してもIAの中には残り続けるだろうと思ってたのに
突然robot.txtにより禁止で今まで保存してきた魚拓もすべて見れなくなった
自分のしてきた事は何の意味も無かった結局何も残らないんだと思うととても虚しい…何なんこの仕打ちは
名無しさん@お腹いっぱい。 [sage] 2017/06/04(日) 08:48:06.37
イミフ
他人じゃなく自身がアカウント管理してるブログなんだから
公開/非公開の設定問わずいつの記事でも閲覧や編集できるじゃん

別業者の類似サービスへ引っ越しとかも自由だし
なによりオフラインで読み返せるダイアリーとして綴っていくっていう
他者が提供してるのに乗っかるより手近な途があるのに
名無しさん@お腹いっぱい。 [sage] 2017/06/04(日) 21:42:34.02
いずれにせよブログサービスが終了しドメインが解放されたときには不死鳥のように蘇ることになるであろう
名無しさん@お腹いっぱい。 [sage] 2017/06/05(月) 11:13:16.50

人ん家で遊んでるだけなのに何を勝手なこと言ってるんだ?
そこまでやりたかったら持ち家買えよ。

ユーザ用の空間をディレクトリ形式 (blog.example.com/user/) で提供している所は
robots.txt から見れば「管理権無しの借家人」だからしゃーないわな。
名無しさん@お腹いっぱい。 [sage] 2017/06/07(水) 10:41:31.93
1月ごろまではフル取得できてたサイズのフォトギャラリー的なページが
最近取るとところどころ歯抜けになる
pngやjpgの個別アーカイブめんどいが取れるだけ良いか
名無しさん@お腹いっぱい。 [] 2017/06/10(土) 04:54:34.00
今やったらrobotで魚拓できなくなってたサイトがまたできるようになってる!嬉しい!
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 10:24:53.43
自身のブログなんかIAでとってるやついるんだね
すごいキモい
こいつの事なんて他者はぜんぜん興味ないってのに
大仰にも「生きた証」とか・・・病的な自意識過剰やばい
危険人物
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 10:42:28.27
なんか変な人来ちゃった
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 12:25:31.02
炎上でもした時に自らが残した魚拓を掘り起こされて泣きを見るのはそいつ自身
自業自得
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 13:14:13.65
ブログ = 炎上って放火魔の発想じゃね
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 16:48:28.74
何を残そうが人の勝手
IAの趣旨には沿ってるし
名無しさん@お腹いっぱい。 [sage] 2017/06/10(土) 18:59:22.23
うん、何を残してもいいと思うけど
突っ込むならば
大事な物をいつまでも残しておく手段にIAを使う
という所では^_^;
名無しさん@お腹いっぱい。 [sage] 2017/06/11(日) 01:17:03.81
自殺配信して死んだだるまが生きた証と言って残したブログも速攻で消されたけど誰かがIAに保存してたおかげで読めたな
名無しさん@お腹いっぱい。 [sage] 2017/06/11(日) 01:58:42.80
いい話だなあ
名無しさん@お腹いっぱい。 [sage] 2017/06/11(日) 06:23:44.63
amebloをIAで開くと、トップページはアーカイブされているけど、
月別や個々のURLを入れるとアーカイブされていないことが多い。
まあ、amebloに限った話じゃないが。
名無しさん@お腹いっぱい。 [sage] 2017/06/26(月) 01:23:07.16
HTMLだけで画像が全滅してるやつってどういうアーカイブのされかたなんだろ
名無しさん@お腹いっぱい。 [sage] 2017/07/07(金) 22:15:10.17

普通に有り得る例としては、そのサイトに直リン除けが掛けられていて
画像向けのリファラーのチェックが行われていたとか。
名無しさん@お腹いっぱい。 [sage] 2017/07/08(土) 00:56:44.12
Alexaのは画像なかったりするみたいね
名無しさん@お腹いっぱい。 [sage] 2017/07/12(水) 16:31:21.72
伺かの小鳩とクロver1.0の2003年のファイル落としたら
中に2007年と2008年と2015年の日付のファイルが入ってた謎
名無しさん@お腹いっぱい。 [sage] 2017/07/12(水) 17:12:45.51
日本語で
名無しさん@お腹いっぱい。 [sage] 2017/07/12(水) 17:57:20.43
これの事
ttps://web.archive.org/web/*/http://kumamoto.cool.ne.jp:80/sorakarakobato/kobato_ver.1.0.nar
名無しさん@お腹いっぱい。 [sage] 2017/07/12(水) 22:43:57.30
何か意味あるのかな。
ブログでトップに表示させるために2050年とかの記事があるようなものだったりするの?
名無しさん@お腹いっぱい。 [sage] 2017/07/14(金) 13:10:28.89
何かまた見れなくなったサイトがあるんだが
余計な改悪してそう
名無しさん@お腹いっぱい。 [sage] 2017/07/15(土) 15:00:32.61
何年か前からURLに「:80」が入るバグで見れないパターン出てくるな
名無しさん@お腹いっぱい。 [] 2017/07/18(火) 05:49:05.50
これ、もうすぐ完全にダメになりそうだ
名無しさん@お腹いっぱい。 [sage] 2017/07/27(木) 21:02:13.39
復活マダ〜?!チンチン!!
名無しさん@お腹いっぱい。 [sage] 2017/07/28(金) 01:59:47.19
どうにかなってたの?
名無しさん@お腹いっぱい。 [] 2017/07/28(金) 11:48:29.31
過去の保存アーカイブの大半が死んでる。検索機能も駄目だし…

ミラー鯖は若干は検索機能でヒットするがやはりあるはずアーカイブにはエラーなのかたどりつけない。
名無しさん@お腹いっぱい。 [sage] 2017/07/28(金) 17:22:45.77
アーカイブ済ページから未アーカイブページへのリンク踏むと
前はsave this url画面になったのに
こないだから404になっていちいちボックスにurl入れなきゃなので面倒
名無しさん@お腹いっぱい。 [] 2017/07/28(金) 19:23:03.47
とうとうミラーのtopまで落ちた…
名無しさん@お腹いっぱい。 [sage] 2017/07/29(土) 21:20:01.40
そんな調子悪いのか
名無しさん@お腹いっぱい。 [sage] 2017/07/31(月) 02:10:36.37
末期感みなぎって来たねー
名無しさん@お腹いっぱい。 [sage] 2017/07/31(月) 03:28:01.11
情報求めて初めて来たが、こんな板あったのか……
繋がらないのは俺だけじゃなかったんだな……
ここ使えないとマジで困りますよ……
名無しさん@お腹いっぱい。 [sage] 2017/08/01(火) 08:56:54.10
トップ(ホーム)ページが糞化しすぎ。
名無しさん@お腹いっぱい。 [sage] 2017/08/04(金) 18:31:32.95
503と504で全然つながらない
あと1年で終わるんだろうな
名無しさん@お腹いっぱい。 [] 2017/08/04(金) 20:16:57.48
昨日から久しぶりに使ってたんだが、全然つながらなくなったので調べてたが
ずっと調子悪かったのか
便利なんだけどな
名無しさん@お腹いっぱい。 [] 2017/08/05(土) 11:39:53.24
日刊ス○ーツ公式
記事に関して新しいものが取得できなくなってる!?

2〜3日前までに取った記事は表示できるんだが

魚拓で取得不可能になったから(トップページは除く)
ここが使えないと何気に困る
名無しさん@お腹いっぱい。 [sage] 2017/08/06(日) 17:17:00.96
ページによって時系列表示が出るのと出ないのがあるけど、何が違うんだろう?
名無しさん@お腹いっぱい。 [sage] 2017/08/07(月) 04:38:18.77

/save/ で行けてるみたいだけどなぁ。
名無しさん@お腹いっぱい。 [sage] 2017/08/16(水) 00:08:42.74
日付が変わって昨日になるが、18時ごろから1時間くらい、
タイムアウトとか言って、使い物にならなかった。

この時間帯で1時間も使えなかったのって、ほんと酷だわ…。
名無しさん@お腹いっぱい。 [sage] 2017/08/16(水) 09:19:32.75
何か特別な時間帯なの?
名無しさん@お腹いっぱい。 [sage] 2017/08/20(日) 21:48:59.46
ちょっと古いブラウザで動かないページってどんな作り方なの?
名無しさん@お腹いっぱい。 [sage] 2017/08/20(日) 23:28:20.85
何が?
名無しさん@お腹いっぱい。 [sage] 2017/08/31(木) 14:11:58.84
IA内に履歴ないURL踏んだときの
セーヴしないという選択なくしたんだな
ちょっと楽ちんになった
名無しさん@お腹いっぱい。 [sage] 2017/08/31(木) 17:01:17.43
そうなの?
名無しさん@お腹いっぱい。 [sage] 2017/09/01(金) 10:16:43.71
だけど、きのう書いたように仕様変更と思いきや
以前と同じく404吐くのに戻っていた

ちなみに昨日取得したページは、某著名人のブログ2017.8.29夕方アップ記事
きょう取得したのは、昨日と同アカのブログ内の昨晩アップ記事
名無しさん@お腹いっぱい。 [sage] 2017/09/01(金) 12:34:48.84
挙動がころころ変わるときはある気がするね。
名無しさん@お腹いっぱい。 [sage] 2017/09/01(金) 21:02:34.83
> IA内に履歴ないURL踏ん
でみたけど
クリックと同時に"Saving page now..."になるページと404のワンクッションおくページとが混在。
中の人らがどこをどういじってるのか知らんが当分は不安定な状態が続きそう。
まーどうにかこうにか取得できてるんでありがたくフリー利用させてもらいまふ
名無しさん@お腹いっぱい。 [sage] 2017/09/02(土) 01:51:59.68
一昨日(8月31日)、「Wayback Exception」という表示が何度も出て、
サイトの取得を妨げていたんだけど、見られた方はいますか?

「Exception」は“例外”という意味らしいけど、毎日のように取ってるサイトで
このような現象が起きたので驚いてる。

因みに昨日(9月1日)は逆に、その表示を一切見ていない。
名無しさん@お腹いっぱい。 [sage] 2017/09/02(土) 06:08:02.02

いわゆるプログラミング用語の「例外」でしょ?
どうして例外が発生したのか見てないの?
名無しさん@お腹いっぱい。 [sage] 2017/09/03(日) 10:40:23.83

そう、確かにその表示なのだが、

>どうして例外が発生したのか見てないの?

そこまでは見ていない、というよりも分からない。

何しろ、普段から取得している複数の新聞社のニュースサイトを
取る作業をしていた際に、この現象が起きたから。
どうにも原因が思いつかない。
名無しさん@お腹いっぱい。 [sage] 2017/09/04(月) 21:57:17.78
Shift_JIS が宣言されていても Windows-31J として処理しくれるような
融通は利かせてくれないものだろうか。
ttp://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/161

@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]_`
abcdefghijklmnopqrstu~∞gョх
括窮欠合紫順灯
@ABCDEFGHIUVW\]^_`abcdefghijklmn
opqrstuvwxyz{|}~淫戒期釧厚匙囚
穿凧諦日琵放愈簾傅哄奧廈戌曉檄滯。「」、・ヲァィゥェォャュョッ
ーアイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマ
ミムメモヤユヨラリルレロワン゙゚瓏磅糶脣蕣褝踰鋺顫鴾

@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_
`abcdefghijklmnopqrstuvwxyz{|}~
胤拐棋屑口冊収埴箭蛸蹄乳眉方油練傴哈奬廐戔暾檢漲
。「」、・ヲァィゥェォャュョッーアイウエオカキクケコサシスセソタ
チツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワン゙゚
磊糺脯蕘襠踴鍄顯鵆
@ABCDEFGHIJK
名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 02:25:34.26
(´‥∀‥`)ほう
名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 00:12:02.88
は (0x8794) が 這 (0x9487) に化けてるけど、これは 2ch 側の問題だな。
具体的には、 の文字の 1 個以上の連続のうち、先頭バイトだけが
なぜか HTML 上では脱落する。
専ブラで dat を直接読んでいれば脱落は起こらない。

バイト列で表現するとこんな感じ。
41 41 87 94 87 94 87 94 87 94 41 41 (AA這這這尿A)

41 41 -- 94 87 94 87 94 87 94 41 41 (AA這這這尿A)
ttp://web.archive.org/web/1/mevius.2ch.net/test/read.cgi/esite/1475246713/163

算術記号の ではなくて、ギリシャ文字の Σ (0x83B0) だと起こらない。
名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 15:43:52.89
ほんとだ直アクセスでもそんな感じだな
名無しさん@お腹いっぱい。 [sage] 2017/09/09(土) 15:12:07.27
取得したページ上部のデザインがまた変わったなあ
小さくなったり大きくなったり極端だ
名無しさん@お腹いっぱい。 [] 2017/09/14(木) 10:27:22.74
(過去にもあったけど)
一部のサイトで、以前取ったアドレスが、取れなくなってるな。
取っても、現時点で最新のものしか出てこない。

ttp://https://web.archive.org/web/20170913155359/https://www.daily.co.jp/gossip/
ttp://https://web.archive.org/web/20170913094650/https://www.nikkansports.com/battle/
名無しさん@お腹いっぱい。 [sage] 2017/09/16(土) 18:16:34.78
悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた


朝鮮進駐軍 関東大震災 日本人大虐殺
ttp://https://goo.gl/1ntWvZ
ttp://https://youtu.be/D0vgxFC04JQ
ttp://https://goo.gl/h1o4eV
ttp://https://www.youtube.com/watch?v=sYsrzIjKJBc
ttp://https://goo.gl/FTqHJ1
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 14:00:49.17
こういうのもちゃんと読んで反応してるんだろうか
問答無用で弾いてるような印象があるが
ttp://http://yahoo-mbga.jp/robots.txt
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 14:03:00.66
User-Agent: *
Disallow: /

もうこれだけ読んでやめてる気がしてならない
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 19:07:51.75
10分くらい前から使えなくなってる
何が起きた
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 19:08:23.33
繋がらんな
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 19:12:57.86
一応戻ったが、何でまた急に…
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 19:13:02.20
なおったか
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 19:23:19.47
今落ちてないかい?
ついに…
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 19:26:13.63
うむ、まただ

メンテの予告はないよね?
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 19:26:58.18
落ちてるね
このところ順調だったけど
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 19:30:42.72
ネットワーク診断結果

デバイスまたはリソース(web.archive.org)が応答していません。
名無しさん@お腹いっぱい。 [] 2017/09/20(水) 19:31:33.35
もう、急に何ヒス起こしてるんだよ…
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 19:38:10.25

問答無用も何も、その robots.txt を規則通りに解釈したら
Internet Archive (ia_archiver) の場合は全拒否になるのだが。

| User-Agent: ia_archiver
| Disallow: /

この少し後ろに "User-Agent: *" で始まるグループがあるが、
上の "User-Agent: ia_archiver" を優先するため無視される。

| User-Agent: *
| Disallow: /
| Allow: /sitemap
| Allow: /$
| ...

仮に上の "User-Agent: ia_archiver" とその次の行が無かったとしても、
Internet Archive は Allow 命令には対応していない。
つまり、"User-Agent: *" とその次の Disallow 命令だけが解釈されて、
どっちみち全拒否となる。
名無しさん@お腹いっぱい。 [sage] 2017/09/20(水) 20:39:47.04
何度かYahooスポーツの世話になっていたが、久しぶりに古いページを
見ようとしたらデータが取れなくなってるな。
名無しさん@お腹いっぱい。 [sage] 2017/09/26(火) 21:11:20.42
取得時モッサリと重たいんだけど時間帯のせいかな
名無しさん@お腹いっぱい。 [sage] 2017/09/27(水) 06:43:46.15
Saving page now...が消えたと思いきやまた表示され
Saving page now...が今度こそ消えたと思いきやまた表示され
Saving page now...が(ry
この自動ループに陥って結局手動で停止させるんだが
後から確認してみると取れてるのと取れてないのが2:1ぐらい
めんどくせ
名無しさん@お腹いっぱい。 [sage] 2017/09/30(土) 09:53:51.13
モサーリ爆進中
名無しさん@お腹いっぱい。 [sage] 2017/10/01(日) 01:02:16.28
根気テストされてるに違いない
名無しさん@お腹いっぱい。 [sage] 2017/10/02(月) 11:53:53.32
画像が全然保存できてないな

下手するとさっき保存したものよりも同じページの2009年くらいのスナップショットのほうがたくさん画像が見れたりする
名無しさん@お腹いっぱい。 [] 2017/10/02(月) 19:51:18.22

Bummerが3〜4回繰り返されるので
既に根気もくそも無くなってるわ

特に19時台が酷い気がするけど
単に気のせいかな
名無しさん@お腹いっぱい。 [sage] 2017/10/02(月) 21:30:39.54
気のせいだお
全時間帯まんべんなく酷い
名無しさん@お腹いっぱい。 [sage] 2017/10/02(月) 23:44:48.37
ウェブ魚拓も「スカ」が多くなったな
魚拓の類がこんな調子だと本当に困る
名無しさん@お腹いっぱい。 [sage] 2017/10/03(火) 18:10:31.64
もうBummer出るのがデフォになってるな
改善される時は来るのだろうか
名無しさん@お腹いっぱい。 [] 2017/10/04(水) 20:16:52.84
URL検索機能が相変わらず死んだまんまや…
名無しさん@お腹いっぱい。 [sage] 2017/10/04(水) 21:57:06.86
検索機能って/*/〜*みたいなやつ?
名無しさん@お腹いっぱい。 [sage] 2017/10/15(日) 18:42:33.29
wikiにつながらない
名無しさん@お腹いっぱい。 [sage] 2017/10/15(日) 20:29:29.29
はぁ?
名無しさん@お腹いっぱい。 [sage] 2017/10/16(月) 16:17:25.01
上旬は先月よりだいぶ調子よかったが昨日からまたダメダメ
名無しさん@お腹いっぱい。 [sage] 2017/10/21(土) 14:00:43.25
/脱落に因む404大杉
名無しさん@お腹いっぱい。 [sage] 2017/10/23(月) 14:40:32.65
去年冬ごろ取得したのは"/"が勝手に加えられての404が多かった
名無しさん@お腹いっぱい。 [sage] 2017/10/24(火) 01:09:43.67
なんやそれ
名無しさん@お腹いっぱい。 [sage] 2017/10/26(木) 00:50:42.39
悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた


朝鮮進駐軍 関東大震災 日本人大虐殺
ttp://https://goo.gl/FTqHJ1
ttp://https://goo.gl/1ntWvZ
ttp://https://youtu.be/D0vgxFC04JQ
ttp://https://goo.gl/h1o4eV
ttp://https://www.youtube.com/watch?v=sYsrzIjKJBc
名無しさん@お腹いっぱい。 [sage] 2017/10/30(月) 09:15:18.95
ページ自体が表示されないが、今はどういう状況? メンテ中?
名無しさん@お腹いっぱい。 [sage] 2017/11/01(水) 22:03:58.93
Wayback Exception
An unknown exception has occurred. Unexpected Error

こればっか
名無しさん@お腹いっぱい。 [sage] 2017/11/24(金) 13:46:14.14
アーカイヴされたことないページへのリンク踏んだら
久々に404にならず"Save this url in the Wayback Machine"が現れてクリック取得ができた
これ常時できてたのって夏休み前だったから感動すら覚える
名無しさん@お腹いっぱい。 [sage] 2017/11/24(金) 22:36:52.60
うむ、
名無しさん@お腹いっぱい。 [hage] 2017/11/24(金) 22:51:45.43

夏休みかぁ。若いって良いなぁ。
名無しさん@お腹いっぱい。 [] 2017/12/12(火) 17:05:40.69
サイトで友達が稼げるようになった情報とか
⇒ ttp://http://rprpe093w.sblo.jp/article/181823411.html

興味がある人だけ見てください。

SOF53Y4MWW
名無しさん@お腹いっぱい。 [sage] 2017/12/15(金) 14:46:48.96
さて
名無しさん@お腹いっぱい。 [] 2017/12/17(日) 18:45:14.54
ちくしょ完全にダウンしやがった、、
名無しさん@お腹いっぱい。 [sage] 2017/12/17(日) 18:55:40.85
2h前にあった現地の停電の影響
さすがに回避不能だしイラついてもしょうがない
大人しく復旧を待とう
名無しさん@お腹いっぱい。 [sage] 2017/12/19(火) 19:03:04.11
今日も調子悪いね
名無しさん@お腹いっぱい。 [sage] 2017/12/19(火) 19:31:07.30
日常な気がしてきた
名無しさん@お腹いっぱい。 [sage] 2017/12/19(火) 20:14:35.23
あーーーー何か来たぞーーーー
名無しさん@お腹いっぱい。 [sage] 2018/01/01(月) 15:04:20.22
新年早々だめだこりゃ
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 15:44:23.36

取得しようとしたら、一旦反応はあるものの、
なぜか取得する前段階の画面に戻ってしまっていたな。

結局、1月1日は終始そんな状態だったが、
1日中使えなかったのはあまりに痛すぎる。
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 20:29:56.52
去年10月の第一週に取得しといたのが半分ぐらい駄目になってる
重要だと思うページは取れてるか確認してみたほうがいい
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 21:15:03.46

2015 年よりスクリプトで毎日一回ずつ保存させているものがあるんだけど、
昨年 10 月は第一週に限らずポツポツと抜けている。
URL は公開したくないのでスクショでご勘弁。
ttp://i.imgur.com/4qDvnsI.png
ttp://i.imgur.com/l0lfBpa.png
ttp://i.imgur.com/ZKixGUA.png
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 21:24:36.49
4月29日何があった
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 21:58:08.32

スクリプトってどんな感じの?参考にしたいからやり方教えて下さいm(__)m
214 [sage] 2018/01/04(木) 22:01:04.72

403 ページが繰り返し記録されているので Internet Archive の問題ではない。

ちなみにスクリプトは /save/ にリクエストを投げてから、リダイレクトを処理して
最終的に 200 番か 504 番の応答が返ってくれば保存できたと判断、
それ以外なら計 10 回まで試行するように組んである。
ログは取っていないので、保存できなかった日にどういう応答が
返ってきていたのかは判らない。
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 22:59:58.51
10月散々だな・・・ここのログ読んでも9月末から10月までは大分やばそうな感じだし、見直してみるか
名無しさん@お腹いっぱい。 [sage] 2018/01/04(木) 23:15:25.28

スクリプトを作成する技術があるのなら、アーカイブするよりも
そのページを直接ハードディスクにhtml(またはmhtml)で保存
するほうが確実ではないのか?
214 [sage] 2018/01/05(金) 03:49:29.13
以下長文失礼。


いわゆる「証拠保全」の目的で、ブログなどを保存させることもあるでしょう・・・。


こちらでは Windows Scripting Host 用のスクリプトを JScript で書き、
それを Windows のタスクスケジューラで実行させている。
以下、Internet Archive へ仕掛けるアクセスの内容と、HTTP の応答コードの扱いについて簡単に。

1) 保存させたい URL の前に ttp://https://web.archive.org/save/ を付けて、
その URL 向けに HEAD リクエストを投げさせる。
2) 300 番台の応答 (リダイレクト) が返って来た場合、順次追跡して HEAD リクエストを投げさせる。
これは、使用する API によっては特に記述せずとも勝手にやってくれる。
3) 最終的に 200 番の応答が返ってくれば、たぶん保存できている。

保存成否は HTTP の応答コードだけでほぼ判定できる。
コンテントボディは不要なので HEAD メソッドを使っているが、
HEAD を扱えない環境なら GET メソッドでも問題無い。

数百メガバイトの巨大ファイルを保存させようとした場合など、
オリジンサーバから Internet Archive への転送に時間が掛かってしまうと
途中でタイムアウトとなり、504 番の応答が返ってきてしまう。
スクリプトを汎用とする (URL を別途パラメータとして与える) のであれば、
これも一応「保存できた」として扱った方が無難。
504 でも保存がキャンセルされる訳では無いようで、
これをエラーとして扱い再試行させてしまったがために
巨大ファイルを短い間隔で重複して保存させてしまったことがある。
216 [sage] 2018/01/05(金) 20:15:59.49

ご丁寧にご解説ありがとうございましたm(__)m

定期保存の方法は大体理解できたのですが
当方JScriptに詳しくないのでスクリプトの具体的な書き方がわかりません(ノД`)・゜・。

ご無理は承知しておりますが
Pastebin.comなどにスクリプトのサンプルを貼って頂けると有り難いのですが・・・
ぜひとも後学の為によろしくお願い致します。(o_ _)o))
名無しさん@お腹いっぱい。 [sage] 2018/01/05(金) 21:16:22.82
スレ違い
しかも今どきm(__)m (ノД`)・゜・。 (o_ _)o))の顔文字
キモいキモすぎる
名無しさん@お腹いっぱい。 [sage] 2018/01/06(土) 15:47:30.36
専門板って時間の流れが違う人多いよね
名無しさん@お腹いっぱい。 [sage] 2018/01/06(土) 17:38:17.30
時間の流れ方は人それぞれだし、顔文字とか個性があるのは別にいいんじゃない
Internet Archiveに関するスクリプトなら満更スレ違いとも言えないだろうし
Pastebin指定している所見ると、極力スレに迷惑かからないように考慮しているみたいだし
大体このスレ、1年過ぎても1スレの1/5くらいも消費してないくらい話題ないんだから
多少のスレ違いは問題ないっしょ
名無しさん@お腹いっぱい。 [sage] 2018/01/06(土) 19:40:14.08
>スクリプトの具体的な書き方がわかりません(ノД`)・゜・。

から判るのは"参考"までに問うてみるなんてレベルには
背伸びしても達しない現状を隠しつつを書き
レスが来たと見るやベース丸コピの勢いで乞食メンタリティを現す
呆れた自己中クレクレ厨という事実
216 [sage] 2018/01/06(土) 22:55:52.85
私のせいでスレが荒れてしまってすみません(>_<)
すべて無知で乞食で心が貧しかった私のせいです。。。
気分を害された方々、本当に申し訳ありませんでしたm(__)m
名無しさん@お腹いっぱい。 [sage] 2018/01/09(火) 16:59:38.81


ひとくちに専門板といっても
この板とシャワートイレ板や文房具板では雰囲気がまったく違う。
名無しさん@お腹いっぱい。 [sage] 2018/01/12(金) 11:17:09.62
懐かしいこの使い心地
名無しさん@お腹いっぱい。 [] 2018/01/12(金) 22:39:58.08
今さっきからメンテナンスに入った
今日は夕方あたりから「503」乱発だったから仕方ないか…

というか昨日・一昨日あたり消えてるっぽいものもあるのだが
名無しさん@お腹いっぱい。 [sage] 2018/01/13(土) 08:11:09.82
てか1月10日及び11日の分
やっぱり消えてるわ
名無しさん@お腹いっぱい。 [] 2018/01/13(土) 08:32:56.05
ありゃりゃ
名無しさん@お腹いっぱい。 [sage] 2018/02/27(火) 05:25:01.33
過去に取得されてるURLを現在の表示内容に更新する為に再度保存するにはどこのボタンを押せばいいんですか?
名無しさん@お腹いっぱい。 [sage] 2018/02/27(火) 05:28:59.49

そんなボタンはありません。
名無しさん@お腹いっぱい。 [sage] 2018/02/27(火) 08:43:21.75
☆ 日本の、改憲を行いましょう。現在、衆議員と参議院の
両院で、改憲議員が3分の2を超えております。
『憲法改正国民投票法』、でググってみてください。国会の発議は
すでに可能です。平和は勝ち取るものです。お願い致します。☆☆
名無しさん@お腹いっぱい。 [sage] 2018/02/27(火) 20:45:30.03

ttp://https://web.archive.org/ の【 Save Page Now 】セクションに
URL入力欄とボタンがあるじゃろ

Capture a web page as it appears now for use as a trusted citation in the future.
名無しさん@お腹いっぱい。 [sage] 2018/03/02(金) 07:42:32.15

御礼が遅れましたがありがとうございました
貴方良い人だ
名無しさん@お腹いっぱい。 [sage] 2018/03/03(土) 14:40:00.74
取得歴0のページを新たにセーブしても"2 captures"になるのって何なんだろ
名無しさん@お腹いっぱい。 [sage] 2018/03/05(月) 18:14:49.67
去年保存されてしばらくは完全に保存されてたページが
いつの間にかそのページの画像の大半が失われてた
名無しさん@お腹いっぱい。 [sage] 2018/03/07(水) 22:29:59.08
This URL has been excluded from the Wayback Machine.
なサイトが復活した事例ってある?
BIGLOBEの例とか見るに必ずしも運営者が手を回したわけじゃないようだし、問い合わせたら復活したりするんじゃないかと思ったんだが
名無しさん@お腹いっぱい。 [sage] 2018/03/12(月) 00:57:39.67
Archive.is で Facebook のアーカイブが取れなくなっている。

Archive.is のクローラは Facebook 上では登録ユーザとして振舞っていて、
パブリックでは無いコンテンツのアーカイブも取れるようになっているのだが
そこで使われていたアカウントがブロックされたっぽい。
ttp://Archive.is/TT0nA
Masha とか Nathan とか、過去にアカウント名が変わったことが何回かあるので
今回が初めてでは無いのかも。


聞いたことが無いですね・・・。
名無しさん@お腹いっぱい。 [] 2018/04/17(火) 11:35:00.65
今日深夜ずっと繋がらないんだけど何かあった?
名無しさん@お腹いっぱい。 [sage] 2018/04/20(金) 09:29:40.69
Archive.isはweb.archive.orgと違ってソース見るとリンクが別の文字列に置き換わるんだな
だから記録したリンクのアドレスをソースで調べようとしてもわからない
リンクアドレスが直接サイト上にすべて表示してあるなら大丈夫だけど
web.archive.orgtが禁止してるサイトを記録できるのはありがたいが中途半端
名無しさん@お腹いっぱい。 [sage] 2018/04/23(月) 22:52:27.15
悪いひとたちがやって来て
みんなを殺した

理由なんて簡単さ
そこに弱いひとたちがいたから

女達は犯され
老人と子供は燃やされた

悪いひとたちはその土地に
家を建てて子供を生んだ

そして街ができ
悪いひとたちの子孫は増え続けた


朝鮮進駐軍 関東大震災 日本人10万人大虐殺

ttp://https://youtu.be/iBIA45CrE30
ttp://https://youtu.be/D0vgxFC04JQ
ttp://https://www.youtube.com/watch?v=sYsrzIjKJBc
ttp://https://www.youtube.com/watch?v=SiHp41uWo1I
ttp://https://www.youtube.com/watch?v=zYBCTRryFP8
ttp://https://youtu.be/-wF31xbwqPM
名無しさん@お腹いっぱい。 [sage] 2018/05/22(火) 18:37:32.43
あー重い重い
名無しさん@お腹いっぱい。 [sage] 2018/05/24(木) 23:16:48.78
最近は激烈重いな
名無しさん@お腹いっぱい。 [] 2018/05/31(木) 08:55:50.66
別のところで耳にしたので本当かどうかわかりませんが
webarchiveを用いて消えてしまったリンク
例えばttp://www.chinpoppo.ne.jp/images/xxxx.jpg
が昔あったが現在images以下が表のページからのリンクが消されたとして(サーバー内には存在するる)
その画像一覧をWebarchiveを用いると現在のページからも落とせると聞いたが本当でしょうか?
もし可能ならその方法を,またWebarchiveを用いないで出来る方法があれば教えてください
スレ違いならこの質問に適したスレを教えてください
名無しさん@お腹いっぱい。 [hage] 2018/05/31(木) 10:37:12.73

日本語でおk。

「Wayback Machine に保存されているファイルの一覧」は出力できても、
「元サーバには置いてあっても Wayback Machine では保存しなかったファイルの一覧」なんか
出力できるわけ無いわ。
名無しさん@お腹いっぱい。 [sage] 2018/05/31(木) 22:03:23.29
/*
名無しさん@お腹いっぱい。 [] 2018/06/01(金) 09:35:59.56

ありがとうございました
名無しさん@お腹いっぱい。 [sage] 2018/06/23(土) 22:07:00.35
このアーカイブてデータをSSDに全部入れ替えたら
アクセスすごい速くなるんだろうな、金額や手間を
考えたら途方もない話だろうけど
名無しさん@お腹いっぱい。 [sage] 2018/06/24(日) 21:17:52.37
ストレージの速度も大事なんだろうけれど
データベース系はメモリが足らないとダメなんだろうなって気がする
それこそカネがかかる話だけれどもね
名無しさん@お腹いっぱい。 [sage] 2018/07/05(木) 01:48:27.48
ここ数日 /save/ で保存を試みても失敗することが多くなった。
数回ないし十数回リロードすれば通るけど、本当に鬱陶しい。
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 04:58:10.52

右に同じ。

しかも、
>数回ないし十数回リロードすれば通るけど

これがまた結構時間をロスする。
意外とこのサイトの重要性は高まっているので、
ここが機能しなかったら本当に困る。
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 05:50:54.11
というか基本的な話だが、
同じサイトを複数回取る場合(頻繁にトップページが変わる、新聞社の公式とか)、
Internet Archiveは『10分程度』、間(あいだ)を置かなきゃダメなんだよね。

「Wayback Exception」でタイムロスがあっては尚更困るんだが。
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 13:46:21.85
他のアーカイブも利用しろよ
やたら重くていけねえ
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 15:39:37.64
もちろん他のところも利用してるけど、
1日20回限定だったり、サイトの方から拒否しちゃったりでねえ…

それにしてはここ数日、
InternetArchiveにアクセスが集中しすぎているのか?
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 18:11:15.42
なんかよく分からんエラー出て使えないと思ったらやっぱ不調なのね
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 18:13:12.53
というか好調のときってあるのかここ
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 19:14:44.12
午後から本当に「Sorry」ばかりでガチで不調

一時期のウェブ魚拓もそうだったが
不可解な画像を多量にアーカイブするような
平たく言えば「荒らし」が出てきてるのか?
名無しさん@お腹いっぱい。 [sage] 2018/07/07(土) 23:50:33.04
困ったねぇ。
名無しさん@お腹いっぱい。 [sage] 2018/07/10(火) 19:44:19.48
今日はこればっかり。
名無しさん@お腹いっぱい。 [] 2018/07/12(木) 17:50:11.87
保守
名無しさん@お腹いっぱい。 [sage] 2018/07/15(日) 01:03:22.54
確信
名無しさん@お腹いっぱい。 [] 2018/07/24(火) 06:42:47.65
これが無くなるとかなり困るな
名無しさん@お腹いっぱい。 [sage] 2018/07/24(火) 19:26:12.66
そりゃな
既存の蓄積の替えがきかないという意味ではGoogleとかよりよっぽど重大だな
名無しさん@お腹いっぱい。 [sage] 2018/07/25(水) 10:07:04.60
いっそグーグルが買収してその脅威のメカニズムで
ウェイバックをワード検索できたり、負荷を軽くしたりプログラムを再構成してくれないかな
名無しさん@お腹いっぱい。 [sage] 2018/07/25(水) 10:39:55.70

「他人の著作物を勝手に保存してそのまま勝手に再公開する」という
インターネット・アーカイブがやっている行為について訴訟が起こされたけど、
非営利組織であることが米国著作権法のフェアユース規定を適用できるかどうかの
鍵となっていたはず。
買収で営利組織の傘下に入ると、おそらくそこが崩れて
保管されているアーカイブの殆どが違法コピーに成り下がる。
名無しさん@お腹いっぱい。 [] 2018/07/29(日) 21:16:40.87
名無しさん@お腹いっぱい。 [sage] 2018/07/30(月) 08:56:57.18

厳しい局面を迎えているんだな
その訴訟は継続中なのかな?
結果次第では他の類似サイトにも確実に影響が出る…
名無しさん@お腹いっぱい。 [sage] 2018/07/31(火) 01:34:50.00
訴訟されてたとは初目目
名無しさん@お腹いっぱい。 [sage] 2018/08/27(月) 22:33:15.82
最近数週間ずっと調子よかったのに
今日は1度めトライで成功するページが2割ぐらい
名無しさん@お腹いっぱい。 [sage] 2018/10/01(月) 00:15:17.25
最近はどう?
名無しさん@お腹いっぱい。 [sage] 2018/10/01(月) 09:42:09.77
自分とこの環境だと今日は
優──良──可──不可
   ↑
 この辺り
名無しさん@お腹いっぱい。 [sage] 2018/10/02(火) 00:22:35.28
結構いいやん
名無しさん@お腹いっぱい。 [sage] 2018/10/02(火) 03:21:26.34
「Yahoo!ジオシティーズ」が2019年3月末でサービス終了
ttp://http://news.livedoor.com/lite/article_detail/15383313/
名無しさん@お腹いっぱい。 [] 2018/10/02(火) 18:31:41.89
頼れるのがInternet Archiveしかいない…!
名無しさん@お腹いっぱい。 [sage] 2018/10/02(火) 21:28:33.03
ジオシティーズ消滅でだいぶ貴重なデータが失われるな
黒歴史サイトが消える〜って喜んでるのも居るがそんなもんより損失が大きいのが
アーカイブされりゃいいけどニフティなんかアーカイブで見れないサイト多い惨状
他では誰も扱っていないすんげーマニアックなデータを蓄積したサイトとか 勿体無い
名無しさん@お腹いっぱい。 [sage] 2018/10/03(水) 12:59:36.15
あれなあ
ドメインレベルで見えなくなってるっぽいのあれなんなんだろうな
名無しさん@お腹いっぱい。 [sage] 2018/10/06(土) 20:02:45.36
ttp://https://archive.org の上の入力欄に URL を突っ込んだ後、
最初に出てくるはずのカレンダ画面が真っ白。
名無しさん@お腹いっぱい。 [sage] 2018/10/06(土) 20:09:05.08
うん同じく
279 [sage] 2018/10/11(木) 02:20:55.03
の件は直ったようだ。
名無しさん@お腹いっぱい。 [sage] 2018/10/15(月) 20:10:09.03
最近まともに動いてるね
名無しさん@お腹いっぱい。 [sage] 2018/10/20(土) 16:16:56.53
いきなり保存できなくなった
名無しさん@お腹いっぱい。 [] 2018/10/21(日) 11:22:22.45
全ページ検索はまだ?
でもモラル上厳しいか
名無しさん@お腹いっぱい。 [sage] 2018/10/21(日) 11:47:41.23
大昔で来てたよね
名無しさん@お腹いっぱい。 [sage] 2018/10/21(日) 18:07:24.21
ジオシティーズ削除までに出来る限りアーカイブしとかんとなあ
アーカイブされてそうで意外とされてなかったりする>ジオ
名無しさん@お腹いっぱい。 [sage] 2018/10/21(日) 18:46:47.27
それな
名無しさん@お腹いっぱい。 [sage] 2018/10/21(日) 19:23:19.76
18日以降にとったキャッシュが全部見れなくなってる こいつぁきつい
名無しさん@そうだ選挙に行こう! Go to vote! [sage] 2018/10/22(月) 07:48:21.85
改めて確認すると17日の夜以降かつ現在の24時間以上前くらいのは全て消えてるは
サイトにもよるのかな やべー
名無しさん@お腹いっぱい。 [] 2018/10/22(月) 12:41:35.09
実質、魚拓やArchive isと比べたら、アーカイブサイトでは一番順調なところなのに。
何で数日前以降のものが消えるかね!?

管理者は気がついてるのか!?
214 [sage] 2018/10/22(月) 12:43:48.87

ウチはどうだろう、と思って見てみたら・・・今月 6 日以降の分が全く保存されていない。
ttp://i.imgur.com/cEWjNjz.png
どうも原因はサーバ不調とは別のよう。参考にならず申し訳ない。

で紹介した手順のまま何も変えていないのだが、明らかにおかしいので
通信内容を追ってみたところ、こちらが送った HEAD リクエストに対して 404 応答を返している。
試しに GET リクエストに切り替えてみると、きちんと 200 応答が返る。多分保存できている。
(以前は途中でリダイレクトがあったはずだが・・・どうだったっけ?)
おそらく仕様が変更されて、HEAD リクエストは使えなくなった、という事だと思う。

以下余談。
の 3 つのスクショと同じ URL、同じ年のカレンダーを再度見てみた。
ttp://i.imgur.com/71H5nOH.png
ttp://i.imgur.com/8aO7RgA.png
ttp://i.imgur.com/dUdgy82.png
の時点では歯抜けになっていた 10 月分が、かなり埋まっている。
名無しさん@お腹いっぱい。 [sage] 2018/10/22(月) 23:54:24.33
月曜日終わりになっても特に改善せず
ここ数日1日以上前の物はすべて消滅
名無しさん@お腹いっぱい。 [sage] 2018/10/23(火) 00:41:13.97
前思い出したように復活したことあるよなあ
今回はどうなんだろう
名無しさん@お腹いっぱい。 [sage] 2018/10/23(火) 16:41:13.19
Access Denied
名無しさん@お腹いっぱい。 [sage] 2018/10/23(火) 18:24:41.33
ここ数日はりきってgeocitiesのアーカイブ保存してたのに消えてるじゃん...最悪
非表示じゃなくてアーカイブごと消滅したってこと?あまり詳しくないからわからんが
名無しさん@お腹いっぱい。 [sage] 2018/10/23(火) 23:47:43.02
火曜日終わりになっても順調に消滅中
なんかアナウンスでも欲しい所
名無しさん@お腹いっぱい。 [sage] 2018/10/24(水) 00:04:11.87
試しにCNNのアーカイブを確認してみると
ttp://https://web.archive.org/web/*/http://us.cnn.com/
やっぱり17日の昼くらいからさっぱりキャッシュが無くなってる
一応全世界的なのかもしれんが、外国の人は気づいているのだろうか?
名無しさん@お腹いっぱい。 [sage] 2018/10/26(金) 07:00:40.48
どうやら復旧した模様 過去の分も含めてリンクが表示されるようになった
どこかにアナウンスとか上がっているだろうか?
名無しさん@お腹いっぱい。 [sage] 2018/10/26(金) 08:55:54.62
直ったのか 良かった良かった
名無しさん@お腹いっぱい。 [sage] 2018/10/31(水) 21:45:12.44
300
名無しさん@お腹いっぱい。 [sage] 2018/11/01(木) 01:59:51.46
ジオ全盛の頃って累積アクセス数でキリ番踏んだら報告するよう書いてる人結構いたなあ
報告めんどくて毎回スルーしてたら後で踏み逃げ常習者として晒されてたりした
懐かしくて確認してみたらアーカイブ取得されてて(ノ∀`)アチャー
名無しさん@お腹いっぱい。 [sage] 2018/11/01(木) 02:33:05.67
悪いことはできないな
名無しさん@お腹いっぱい。 [sage] 2018/11/09(金) 00:01:04.02
どう晒すん?
名無しさん@お腹いっぱい。 [] 2018/11/09(金) 09:26:29.80
ぺージを見すぎるとエラーになる?
名無しさん@お腹いっぱい。 [] 2018/11/09(金) 09:27:20.70
全ページ検索はまだ実現しないんですか?
名無しさん@お腹いっぱい。 [sage] 2018/11/09(金) 10:30:55.67
大昔で来てたよね
名無しさん@お腹いっぱい。 [sage] 2018/11/09(金) 13:46:06.53

先月、毎日保存に使っているWebブラウザだと
ttp://https://web.archive.org/save/
できなくなったのは、ブラウザのCookieを削除したらできるようになった。
名無しさん@お腹いっぱい。 [] 2018/11/09(金) 15:20:03.04
Wayback Machine does not have this page archived.
見たかったページさようなら
名無しさん@お腹いっぱい。 [] 2018/11/13(火) 10:50:38.41
また消えてるページがある!?

昨日(11月12日)頻繁に「再読み込み」を促す画面が何度も出ていたが…。
名無しさん@お腹いっぱい。 [sage] 2018/11/13(火) 14:48:03.50
「再読み込み」を促す画面
何これ
名無しさん@お腹いっぱい。 [sage] 2018/11/13(火) 20:29:41.27
最近、google chromeでアーカイブを見ようとすると
「The Wayback Machine is an initiative of the Internet Archive, a 501(c)(3) non-profit, building a digital library of Internet sites and other cultural artifacts in digital form.
Other projects include Open Library & archive-it.org.

Your use of the Wayback Machine is subject to the Internet Archive's Terms of Use.」
ってのが出てきて、先に進めない
別のブラウザだと普通に見えるのに
名無しさん@お腹いっぱい。 [sage] 2018/12/01(土) 01:21:10.86
英語わからん
名無しさん@お腹いっぱい。 [sage] 2018/12/01(土) 02:58:50.17
I don't know English
名無しさん@お腹いっぱい。 [] 2018/12/08(土) 10:22:01.38
ttp://http://members.jcom.home.ne.jp/が見れない
名無しさん@お腹いっぱい。 [] 2018/12/08(土) 10:29:30.08
あとAtwikiも魚拓とろうとするとスパム扱いされてできない
名無しさん@お腹いっぱい。 [sage] 2018/12/08(土) 22:34:13.94

そうか?
名無しさん@お腹いっぱい。 [] 2018/12/09(日) 10:28:12.11

スパム扱いされた例を貼っとく
ttp://http://web.archive.org/web/20181205074744/http://www26.atwiki.jp:80/gcmatome/pages/1017.html
名無しさん@お腹いっぱい。 [sage] 2018/12/11(火) 09:37:18.12

何だろうねぇ。
ttp://http://web.archive.org/web/20181211002734/www26.atwiki.jp/gcmatome/pages/1017.html
念のため、この時に使った User-Agent 文字列を貼っておく。
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:59.0) Gecko/20100101 Firefox/59.0
名無しさん@お腹いっぱい。 [sage] 2018/12/11(火) 09:56:55.30
Mozilla/5.0 (Windows NT 6.1; rv:52.0) Gecko/20100101 Firefox/52.0
これでやってみたら弾かれたw
ttp://http://web.archive.org/web/20181211005436/www26.atwiki.jp/gcmatome/pages/1017.html
名無しさん@お腹いっぱい。 [sage] 2018/12/11(火) 13:50:43.49
atwikiはFirefox 52にトラウマでもあるのか
名無しさん@お腹いっぱい。 [sage] 2018/12/11(火) 19:58:30.15
ふむふむ
ttp://http://web.archive.org/web/20181211102115/www26.atwiki.jp/gcmatome/pages/1017.html
Mozilla/6.0 (Macintosh; Intel Mac OS X 10.13; rv:60.0) Gecko/20100101 Firefox/60.0


/save/ を叩いた時なんだけど、もし点数方式で判定するなら
◎ IP は archive.org の取得用サーバ群の中の何れか一つが使われる。
米国の IP であること、また名前に www が入っていることは加点対象になる可能性あり。
同じ IP からの繰り返しアクセスも加点対象になる可能性あり。
◎ User-Agent を含め、リクエストヘッダはクライアントのものがそのまま転送される。
古いブラウザを使っていると加点対象になる可能性あり。
◎ さらに Via: HTTP/1.0 web.archive.org (Wayback Save Page) が追加される。
これは間違いなく加点対象。

この辺が総合的に判断されて弾かれているのだろう。
保存に成功することもあるので、Wayback Machine だからと言って一律に判断しているのでは無いと思う。
名無しさん@お腹いっぱい。 [sage] 2018/12/11(火) 20:49:04.21
そもそも閲覧回数が多いのってスパムっていうのだろうか
いや本筋と関係ないな
名無しさん@お腹いっぱい。 [sage] 2018/12/12(水) 12:01:20.16
biglobe復活したっぽい?
名無しさん@お腹いっぱい。 [sage] 2018/12/12(水) 13:36:14.82
なにそれ?まじ?
名無しさん@お腹いっぱい。 [] 2018/12/13(木) 12:44:14.27
先週くらいから、上のほうに寄付金募集のバナーが出るようになったな。

しかもIEだと、右上の「×」をクリックしても、どうしたわけかバナーが消えない。

この募集は本気だな。
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 14:08:10.35
将来見たくなった時のためにそれの魚拓も撮っといてくれ
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 16:19:22.29

ttp://http://web.archive.org/web/*/archive.org/
これじゃ足りんのか?
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 16:32:01.50
本気やな
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 16:38:05.04
フィルタにぶっこんで終了
改悪し杉だ
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 18:31:05.91
ウィキのコーヒー1杯みたいな洒落たジョークじゃないと金が集まらんぜ
名無しさん@お腹いっぱい。 [sage] 2018/12/13(木) 19:00:40.93
アーカイブ内は飲食禁止ですので…
名無しさん@お腹いっぱい。 [] 2018/12/24(月) 07:37:21.51
ttp://http://web.archive.org/web/20181223223511/https://www26.atwiki.jp/gcmatome/pages/2928.html
ttp://http://web.archive.org/web/20181223223509/https://www26.atwiki.jp/gcmatome/pages/686.html

またスパム扱いされてる
名無しさん@お腹いっぱい。 [sage] 2018/12/24(月) 11:12:18.71
ハム食べたくなってきた
名無しさん@お腹いっぱい。 [] 2018/12/24(月) 16:33:59.12
221 名前:名無しさん@お腹いっぱい。[] 投稿日:2018/12/22(土) 16:36:12.78

こういう海外サービスを発見した。
まだちょこっとしか試していないが。

Archive.st
ttp://https://archive.st

Time Travel
(ブラウザから「このサイトはやばいかもしれない」
という警告が出たが、おそるおそる行ってみると
特にまずいことはなかった)
ttp://http://timetravel.mementoweb.org
名無しさん@お腹いっぱい。 [] 2018/12/25(火) 15:42:40.96

本日12月25日現在(これでよろしい?)
ttp://i.imgur.com/UCGhQjr.jpg
名無しさん@お腹いっぱい。 [sage] 2019/01/01(火) 02:07:14.14
5ドルは高いなあ
名無しさん@お腹いっぱい。 [] 2019/01/01(火) 06:17:17.53
12月30日に取った分が消えてる!?
名無しさん@お腹いっぱい。 [sage] 2019/01/02(水) 14:42:28.29
“WE’VE REACHED OUR GOAL!”

ttps://i.imgur.com/vH6AgSg.jpg
名無しさん@お腹いっぱい。 [] 2019/01/02(水) 16:26:04.27
保守
名無しさん@お腹いっぱい。 [sage] 2019/01/02(水) 17:30:15.52
何だ俺のサポートはいらなかったんだ
名無しさん@お腹いっぱい。 [sage] 2019/01/02(水) 21:03:41.50
Wayback Everywhereってアドオン使ってるけど他に便利なのないかな
名無しさん@お腹いっぱい。 [sage] 2019/01/03(木) 10:14:56.81
以前のいつかと同じく、18年12月29日深夜から現在に至るまで取得したアーカイブの消失が起きている
注意されたし
◆P0jSlC5fJs [sage] 2019/01/09(水) 13:23:55.37
名前上がらないけどWebrecorderとかInterPlanetary Waybackとか知ってる?
いいぞ〜これ
名無しさん@お腹いっぱい。 [] 2019/01/09(水) 17:39:45.59


クラウド保存でなくローカル保存?
名無しさん@お腹いっぱい。 [sage] 2019/01/09(水) 21:27:16.68
どういうこっちゃ
名無しさん@お腹いっぱい。 [] 2019/01/10(木) 15:23:06.86

使い方がよくわからん。
◆P0jSlC5fJs [sage] 2019/01/11(金) 00:33:29.73
Webrecorderは、Webページからwarcファイルを生成するWebアプリケーション
生成したwarcはコレクションに保存され、そのまま表示したり、
会員なら公開コレクションにすることでURLを貼って公開できる
+ New Sessionの隣の「…」から「Download Collection」でコレクション内のwarcファイルをダウンロードできる

warcファイルは魚拓の規格化された形式で、HTTPのステータスコードから画像や動画までそのページを表示するのに必要な情報を格納している
とりあえずwarcファイルさえあれば後からどうにでもなるから残したいサイトは今すぐcaptureしてこい

warcファイルを表示するには、「Webrecorder-player」というアプリが使える
またWebrecorderのコレクションにwarcファイルをアップロードして追加することも可能なので、そうやって表示や公開をしてもいい

InterPlanetary Waybackはもうちょっと高度な話で、IPFSと連携するためのものなんだけどこれは後でいい
名無しさん@お腹いっぱい。 [sage] 2019/01/11(金) 01:54:02.35
I see.
名無しさん@お腹いっぱい。 [sage] 2019/01/11(金) 16:54:33.71
アプリとかマンドクセ
名無しさん@お腹いっぱい。 [sage] 2019/01/14(月) 23:42:12.54
19/01/13の分から取得したアーカイブが確認不可能になっている
名無しさん@お腹いっぱい。 [sage] 2019/01/14(月) 23:59:40.50
いろいろあるな
名無しさん@お腹いっぱい。 [] 2019/01/15(火) 11:10:48.03
保守
名無しさん@お腹いっぱい。 [sage] 2019/01/23(水) 19:17:49.86
最近無茶苦茶重い時あるな
時間帯にもよるけど
名無しさん@お腹いっぱい。 [sage] 2019/01/23(水) 23:58:37.78
いうほど最近か?
214 [sage] 2019/01/24(木) 03:33:30.27
と同じ URL の 2018 年カレンダーを貼ってみます。
10 月に連続して欠けているのは、Internet Archive の仕様変更に対し
こちらの対応が遅れた () ことが原因です。
ttp://i.imgur.com/aYSmomB.png
ttp://i.imgur.com/35RP1No.png
ttp://i.imgur.com/fRsG33D.png

こちらは URL を公開しちゃってもいいや。
この人の騒動について個人的に興味が無くなってきていること、
また別途取得させている個別エントリのアーカイブで十分なことから、いずれ止めるかもしれません。
ttp://web.archive.org/web/*/blog.goo.ne.jp/chimaki-1014
昨年 3 月以降、一日 2 回の取得に対し計 4 回のスナップショットが記録されているのは、
HTTP から HTTPS へのリダイレクトと HTTPS で取得したブログコンテンツが
それぞれ計上されているためかと思われます。
名無しさん@お腹いっぱい。 [sage] 2019/01/27(日) 16:51:33.96
先週辺りから
「502 Bad Gateway」が
表示されることが多くなった
名無しさん@お腹いっぱい。 [] 2019/01/28(月) 07:20:53.88
NHKニュース公式のスクショが
ちゃんと保存されないポンコツびりには
あきれた
名無しさん@お腹いっぱい。 [] 2019/01/28(月) 07:22:08.67
×ポンコツびり
〇ポンコツぶり

あー本当に腹が立つ
名無しさん@お腹いっぱい。 [] 2019/01/29(火) 10:32:25.48
近々でNHK NE○S W○Bのトップページを
InternetArchive経由で魚拓を取った人は
一度確かめてほしい

なぜか画面が「本日現在」の状態になっているから

ウェブ魚拓ではMETAタグが引っかかって駄目
ArchiveTodayも変な画像(白地に黒文字の注意書き?のみ)
を結果として返してくるので駄目

まさか頼みの綱のInternetArchiveで大失敗するとは思わなんだ

どうしてもN○K NEWS ○EBのトップページを残したければ
画面を直に撮影するしか方法は無いようだ
名無しさん@お腹いっぱい。 [sage] 2019/01/29(火) 13:31:19.65
htmlに本文が入ってなくて、ajax的に別のファイルから読み込むやつはいかんな。
wixも同じ理由で保存されてない。
本文ファイルのキャッシュが残ってたとしても、それを読み込みに行ってくれないのよね
◆P0jSlC5fJs [sage] 2019/01/30(水) 15:31:24.94
で、それはwebrecorderでも保存できないのかい?
名無しさん@お腹いっぱい。 [sage] 2019/02/01(金) 19:43:12.41

使い方が分かりにくいな
記録(魚拓)は取れても
その取り出し方がいまいち分かり辛い

後日に取り出してその当時の状態を
再現できなければ意味がないし
名無しさん@お腹いっぱい。 [sage] 2019/02/02(土) 19:49:25.42

何で「NHK NE○S W○B」のトップページの話を出したかといえば
先週日曜(1月27日)にあった某「国民的」グループの活動休止発表からだった

この時「N○K NEWS ○EB」のトップページでは
最上部の「速報」・そのすぐ下の「JUST IN」・本記事と
同時に3つの見出しで「○活動休止」の文字が並ぶという
何とも稀な状態になっていた

そこでInternetArchiveでページの魚拓を取り
同時にIrfanview経由でスクリーンショットを取った“はず”だったのだが
その画像を何らかの形で保存することをうっかり忘れてしまっていた

そして翌朝になってInternetArchiveを確認したら…
下のような状況になっていた
ttps://i.imgur.com/IBOpfrs.jpg

すなわち明けて1月28日になったが
前日27日に取ったものが表示されないという状態

一応は類似の画像を検索してみたがこんなのしか出なかった
ttps://pbs.twimg.com/media/Dx56MVSV4AEsqgB.jpg
363続き [sage] 2019/02/02(土) 19:50:59.02
そんなわけで試しに1月27日以前に取られたものも表示してみたが
結局どの日でも表示されるのは“作業当日”の画面だった

つまりは二重三重で痛恨のミスをやらかしたことになり
本当に今週はそれを引きずった…

このままでは何か癪に障るので
おまけを罪滅ぼしに置いておく

(1月31日)
ttps://i.imgur.com/E96yEeA.jpg
ttps://i.imgur.com/bCjdPXO.jpg
ttps://i.imgur.com/EAUNldo.jpg

(昨2月1日)
ttps://i.imgur.com/hpvfmr9.jpg
名無しさん@お腹いっぱい。 [] 2019/02/06(水) 12:38:23.06
つまりこういうことですわ…某所の3本見出し
(IA経由だと4本見出しになったが多分すぐに消える)

ttps://i.imgur.com/xBWgiNU.jpg
ttps://i.imgur.com/hie187Y.jpg
ttps://i.imgur.com/3Xzxad7.jpg
名無しさん@お腹いっぱい。 [sage] 2019/02/09(土) 01:56:12.20
時々出てくるこれ、具体的に何かやっているというより、
503 応答のエラーページがこのように書かれているだけとしか思えないんだけどなぁ。
名無しさん@お腹いっぱい。 [sage] 2019/02/09(土) 17:40:02.31

文字通りメンテナンス中と思わせるくらいに
数時間表示される場合もあれば…

この画面が出た後で再読み込みをしたら
すぐにトップ画面に戻る場合もある
名無しさん@お腹いっぱい。 [sage] 2019/02/11(月) 03:28:55.18
リンク先がなにもない真っさらなページだった時ってもう諦めたほうがいいですか?
名無しさん@お腹いっぱい。 [sage] 2019/02/11(月) 11:07:09.41
一概にはいえないがはい
名無しさん@お腹いっぱい。 [sage] 2019/02/20(水) 13:36:23.52
昨日2月19日に取ったものって消えてる!?
名無しさん@お腹いっぱい。 [sage] 2019/02/21(木) 00:37:48.78
たしかに2/19にとったやつが消えてますね
前もこんなこと1週間くらい続いたけど戻ったときがあったので様子見ですかね
名無しさん@お腹いっぱい。 [sage] 2019/02/21(木) 02:05:25.15
おやまあ難儀だねえ
名無しさん@お腹いっぱい。 [sage] 2019/02/25(月) 18:11:13.56
アーカイブのサイトが何だかおかしいね

当サイトは昨日「Sorry,we are busy」なんていう
初めて見た表示が出た

ウェブ魚拓は今日の午前中重かった

Archive isは断続的にキレる

一体全体どうなってるのか
名無しさん@お腹いっぱい。 [sage] 2019/02/26(火) 18:41:52.94
当社?
名無しさん@お腹いっぱい。 [sage] 2019/02/28(木) 18:45:57.30
最近取得してもすぐ消えるな
名無しさん@お腹いっぱい。 [sage] 2019/02/28(木) 20:42:43.21
yahoo!ブログまでサービス終了だ
どんどん老舗が消えていくなあ ネットのデータは儚い
名無しさん@お腹いっぱい。 [sage] 2019/02/28(木) 21:02:55.33
えっまじかよ
名無しさん@お腹いっぱい。 [sage] 2019/03/01(金) 00:34:09.55
ここ3日間くらいは全部アーカイブ消えてるな
名無しさん@お腹いっぱい。 [sage] 2019/03/04(月) 13:45:25.05
Yahoo!ブログ消えるのにYahoo!系はなぜかInternet Archiveで保存しても全部トップページに転送されちゃうから保存できないんだよな…
名無しさん@お腹いっぱい。 [sage] 2019/03/10(日) 19:02:20.66
消えるのか…?
名無しさん@お腹いっぱい。 [] 2019/03/16(土) 12:44:48.31
何だか重くなってるぞ
20分くらい前にはアクセス不能になっていたし
名無しさん@お腹いっぱい。 [sage] 2019/03/22(金) 05:46:37.80
2日前くらいからarchive.orgの再生時画面が小さくなってしまって辛い
全画面だと作業が出来ないしなあ
名無しさん@お腹いっぱい。 [sage] 2019/04/05(金) 17:49:39.15

このトップページ転送本当どうにかならんのかな。
名無しさん@お腹いっぱい。 [sage] 2019/04/05(金) 21:22:53.08
ほんらいのペエジは保存されてるの
名無しさん@お腹いっぱい。 [sage] 2019/04/06(土) 00:51:58.43

何なんだろうなこれ
自前でHeritrix回すとどんな感じになるんだろう

Yahooブログアーカイブ活動の本スレ
ttp://mevius.5ch.net/test/read.cgi/blog/1554380939/
名無しさん@お腹いっぱい。 [sage] 2019/04/06(土) 21:50:02.80
【保存・記録】ウェブアーカイブ総合 Page.01
ttp://mevius.5ch.net/test/read.cgi/internet/1554553882/
名無しさん@お腹いっぱい。 [sage] 2019/04/06(土) 22:44:56.49
魚拓もInternet Archiveも引っ掛からないスレタイって
名無しさん@お腹いっぱい。 [sage] 2019/04/07(日) 02:07:26.56

3 年前に前スレで挙がったスクリプトがそのまま使われてるんだけどな。
ttp://echo.5ch.net/test/read.cgi/esite/1189771222/839-854
名無しさん@お腹いっぱい。 [sage] 2019/04/09(火) 19:23:32.75

サンクス。
adblockの詳細設定のマイフィルターリストに「*/yjsecure.js」を登録してadblock有効で転送されなくなった。
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 16:44:20.47
ボス猫
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 16:44:54.15
失礼誤爆
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 17:54:51.45
ttp://mevius.5ch.net/test/read.cgi/internet/1554553882/78-79">ttp://mevius.5ch.net/test/read.cgi/internet/1554553882/78-79

/save/ を知ってて /web/2/ を知らないとは。
あと保存の際に ttp://http://ttp://https:// を無条件に外すのも考え物。
HTTP から HTTPS へリダイレクトするサイトだと、そのリダイレクトも
保存回数に計上されてしまう。
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 18:40:23.58

そのブックマークレットを作った人間ではないけど、Wayback Machine初心者の自分に/web/2/が何なのか教えて下さい
あと保存回数の計上が増えると何か問題があるの?
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 18:40:36.94
/save/知ってるのはgeocitiesのスレの方で多用されてたからじゃないかな
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 18:44:09.20
/save/と/*/はわりかし有名だと思う
名無しさん@お腹いっぱい。 [sage] 2019/04/10(水) 21:30:16.96

これ
/web/2/は初めて聞いたけどその二つは言うほど特別な知識ではないと思うよ
名無しさん@お腹いっぱい。 [sage] 2019/04/11(木) 00:15:00.50
/0/と/1/は知ってるけど/2/は初めて見た。
名無しさん@お腹いっぱい。 [sage] 2019/04/12(金) 14:03:48.45
今年の2月分
ゴッソリ消えてる!?
214 [sage] 2019/04/12(金) 15:44:18.86

っぽいですね。
ttps://i.imgur.com/gZyzB5u.png

ただ、アーカイビングとインデクシングはそれぞれ独立しているみたいなので、
後者だけでデータの欠落が発生しているという可能性もあると思います。
名無しさん@お腹いっぱい。 [sage] 2019/04/12(金) 16:25:15.40
はえー
214 [sage] 2019/04/14(日) 17:12:22.85
ふっかつっ!
ttps://i.imgur.com/HQYxL1R.png
名無しさん@お腹いっぱい。 [sage] 2019/04/14(日) 17:15:33.25
えがった
名無しさん@お腹いっぱい。 [] 2019/04/19(金) 08:25:11.36
全ページ内全文検索はまだ?

なんか問題でもあるのか?
名無しさん@お腹いっぱい。 [sage] 2019/04/19(金) 16:18:48.21
昔やってたけどすぐ立ち消えたからきつかったんじゃね
名無しさん@お腹いっぱい。 [sage] 2019/04/23(火) 16:43:50.23
Scheduled Maintenance

先ほどからこの表示
長くなりそうか?
名無しさん@お腹いっぱい。 [sage] 2019/04/25(木) 00:54:18.11
IAってrobots.txtを読み込んでるんだな
ttp://https://www.digitaltrends.com/computing/internet-archive-robots-txt/
ttp://https://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/
こういう記事が出てたから完全に読み込まないようになったと思ってたんだが、robots.txtでIAを排除してるサイトを保存してくれなかった
名無しさん@お腹いっぱい。 [age] 2019/04/25(木) 07:38:49.03

機械翻訳使ったのかどうか知らんが、文章の意味を読み取れて無いだけやんか。
名無しさん@お腹いっぱい。 [sage] 2019/04/25(木) 15:36:04.78

米国政府のサイトと米軍のサイト限定って書いてあるな
そこまで強調して書いてある訳ではないとは言えもうちょっと慎重に読もう
しかし、robots.txtが邪魔なら全サイトで無視しちゃば良いのにな
どうせ法的拘束力はないんだし
名無しさん@お腹いっぱい。 [sage] 2019/04/25(木) 18:16:09.24
過去分リストが今日から(?)マイナーチェンジしている件
名無しさん@お腹いっぱい。 [sage] 2019/04/25(木) 18:52:48.09
自動的に最新ログの年に飛ばない気がする。2019年。
名無しさん@お腹いっぱい。 [sage] 2019/05/01(水) 01:04:13.28
改元でなんかいいの録れたら教えてください
名無しさん@お腹いっぱい。 [] 2019/05/03(金) 15:57:31.30
数分前から「HTTP ERROR 400」と出て使えない
名無しさん@お腹いっぱい。 [sage] 2019/05/14(火) 05:19:52.89
手動で1ページ1カテゴリーづつ保存するの面倒くさいんですけど、
自動巡回で指定のサイトやブログをttp://https://web.archive.org/に保存出来る方法なんて無いですよね?
毎日毎日徹夜で保存して疲れた…保存しても保存してもキリがない…
名無しさん@お腹いっぱい。 [sage] 2019/05/14(火) 12:56:17.84

>毎日毎日徹夜で保存して疲れた…
>保存しても保存してもキリがない…

アーカイブサイト全般のユーザーの
最大の悩みでもあるな

一度やり始めたら強迫観念が出てきて
毎日やらねばならなくなる

しかも誰もがやっているわけじゃなさそうだから
自分が休んでも他の人が補完してくれる保証はないしね
名無しさん@お腹いっぱい。 [sage] 2019/05/15(水) 02:06:18.98
やろうと思えばプログラム組んで出来るよ、ネット探せば色々見つかる
さっきWebアーカイブ総合スレに投稿されたやつを転載

0175 py ◆o3kzHb/in8w0 2019/05/14 19:06:58
ttp://https://u1.getuploader.com/irvn/download/1657
web2IAWBM.dms ver0.000.007 WayBackMachineに保存 (web.archive.org) 2019/05/14

web2IAWBM.dmsはIrvineとDorothy2を使ってInternet Archive WayBack Machineに自動登録(保存)するためのスクリプトです。
自動で全てのリンクをたどって保存してくれるはずです。
web2IAWBM.dmsは素人が作った物なので至らない点も多々ありますが、
一応使える水準になったと思われるので公開します。
無料のウィルススキャンはしましたが、念のためもう一度スキャンされることをお勧めします。
同梱のDorothy2(の一部)は別の方が作った物です。
■ Irvine初回起動前に必ず jwordフォルダを削除してください。■

動作試験環境:windows10pro Irvine1.3.1
名無しさん@お腹いっぱい。 [sage] 2019/05/15(水) 02:09:48.66
IAヘビーユーザーが多いであろうここの住人なら、
自動化手段を発見済みかスクリプト自作してる人がいるだろうと思ってたが、案外そういう訳でもないのかな
名無しさん@お腹いっぱい。 [sage] 2019/05/15(水) 05:10:13.79

ありがとうございます。
勇気出して聞いてよかった…頑張る
名無しさん@お腹いっぱい。 [sage] 2019/05/15(水) 07:42:21.01
やっぱり Irvine を土台にするよなぁ。みんな考えることは同じだね。


どうですかねぇ。
ttp://http://web.archive.org/web/*/blog.livedoor.jp/shimon761182/*
ttp://http://web.archive.org/web/*/livedoor.blogimg.jp/shimon761182/*
名無しさん@お腹いっぱい。 [sage] 2019/05/23(木) 16:45:13.77
archive.orgにファイルアップロードしてる人っている?
名無しさん@お腹いっぱい。 [sage] 2019/05/23(木) 21:45:14.89
どんなときもー
名無しさん@お腹いっぱい。 [sage] 2019/05/26(日) 03:07:17.45
重宝していた攻略サイトが消えてしまった・・
アーカイブされていたのに何故?何が原因でまるごと
消えてしまったんだ?
名無しさん@お腹いっぱい。 [sage] 2019/05/26(日) 13:33:28.50
どこ?
名無しさん@お腹いっぱい。 [sage] 2019/05/26(日) 15:46:05.58
archive.orgにファイルアップロードしてる人っている?
名無しさん@お腹いっぱい。 [sage] 2019/05/31(金) 17:26:07.60
ベータ版の新しいSave Page Nowを使ってみたかったからユーザー登録してみた
思いのほかあっさり登録できて少し驚いた
名無しさん@お腹いっぱい。 [sage] 2019/06/07(金) 03:04:34.14
今、サーバーエラー出てる
503 Service Unavailable
No server is available to handle this request.
名無しさん@お腹いっぱい。 [sage] 2019/06/07(金) 04:14:39.73
復活してた
名無しさん@お腹いっぱい。 [sage] 2019/06/08(土) 04:29:23.99
スマホからSave Page Nowを使ってTwitterをアーカイブしようとすると必ずエラーを吐いてくる
PCではそんなことになった経験がないんだけど何がおかしいんだろう

あと、これはスマホもPCも関係ないんだが、
Internet Archiveの場合ツイートがjsonと解釈さ
れてしまう場合が多い
Archive.todayやmegalodonは普通のHTMLコンテンツと解釈してくれるんだが、IAだと何でjsonになってしまうんだろう
名無しさん@お腹いっぱい。 [] 2019/06/25(火) 13:34:53.69
エラー入りました(この表示は初めてだ)

500 Internal Server Error
nginx/1.10.3 (Ubuntu)
214 [sage] 2019/06/25(火) 14:24:49.75
落ちてる落ちてる
ttp://https://twitter.com/internetarchive/status/1143378990826004480
ttp://https://twitter.com/5chan_nel (5ch newer account)
名無しさん@お腹いっぱい。 [sage] 2019/06/25(火) 17:10:05.80
まだ落ちてんのかよ
名無しさん@お腹いっぱい。 [] 2019/06/25(火) 18:07:29.24
まだ駄目だね
名無しさん@お腹いっぱい。 [] 2019/06/25(火) 18:25:49.56
にしてもこうまで長時間の「メンテナンス」はいつ以来か
名無しさん@お腹いっぱい。 [sage] 2019/06/25(火) 22:13:06.38
最近400errorみたいな表示が多かったのは前兆だったのか・・・?
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 01:48:15.81
hmmm
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 04:56:31.21
おっメンテナンス終わったかな?
214 [sage] 2019/06/26(水) 05:24:58.72
ttp://https://twitter.com/internetarchive/status/1143604539695616000
詳しくは述べられていないが何処かで断線していたらしい。
ttp://https://twitter.com/5chan_nel (5ch newer account)
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 11:17:32.59
掃除機か?
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 13:28:47.85
しかし長かったねえ
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 18:58:15.72
鼠じゃないの?
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 20:29:57.40
ミッキーマウスの複数形ってミッキーマイス?
名無しさん@お腹いっぱい。 [sage] 2019/06/26(水) 20:30:13.51
ごめんスレ見誤った
名無しさん@お腹いっぱい。 [] 2019/06/28(金) 20:13:41.33


> ベータ版の新しいSave Page Now


初耳
名無しさん@お腹いっぱい。 [] 2019/06/28(金) 20:25:37.04
あー、すまん。勘違いしていた。
名無しさん@お腹いっぱい。 [sage] 2019/06/28(金) 22:52:24.09
どっちや
名無しさん@お腹いっぱい。 [sage] 2019/07/07(日) 14:56:34.46
どっちらけ
名無しさん@お腹いっぱい。 [sage] 2019/07/13(土) 13:26:19.30
なんか保存済みページをIA開いて記事とかの2ページ目から3ページ目に移動しようとすると2ページ目に移動する(移動できてない)。
なんかちょっとおかしい。
名無しさん@お腹いっぱい。 [sage] 2019/07/14(日) 02:21:08.08
そのサイト
スクリプトでページ切り替えてるんでねーの?
名無しさん@お腹いっぱい。 [sage] 2019/07/14(日) 13:56:13.87
訛っちゅうげ
名無しさん@お腹いっぱい。 [sage] 2019/07/19(金) 06:31:44.32
imgur直リンがSavePageNow出来なくなった。
名無しさん@お腹いっぱい。 [sage] 2019/07/19(金) 21:22:55.64
Twitterをアーカイブすると必ず表示が崩れる人がいるんだが
あれって何なんだろうか
名無しさん@お腹いっぱい。 [sage] 2019/07/19(金) 23:06:25.81
最近保存してないけどツイッターいつもUIが謎の外国語になってたわ
名無しさん@お腹いっぱい。 [sage] 2019/07/20(土) 00:37:36.80

それ多分IAが経由してるサーバーの国の言語で表示されてるんだと思う
名無しさん@お腹いっぱい。 [sage] 2019/07/20(土) 10:05:42.37
の症状が治ったっぽい
鈴木喜三郎 ◆PEYInCbx5g [] 2019/07/23(火) 05:49:06.07
これarchive.vnだと保存できない奴も保存出来るから便利
名無しさん@お腹いっぱい。 [] 2019/07/23(火) 16:22:05.75


> これ


どれ?
名無しさん@お腹いっぱい。 [sage] 2019/07/23(火) 18:20:17.89
これが示すのはInternet Archive Wayback Machineのことだろ。
名無しさん@お腹いっぱい。 [] 2019/07/23(火) 18:28:08.66
そうか
名無しさん@お腹いっぱい。 [sage] 2019/07/27(土) 14:21:28.66
の症状は直らない
名無しさん@お腹いっぱい。 [sage] 2019/07/27(土) 15:47:23.29
具体的にどこよ?
名無しさん@お腹いっぱい。 [sage] 2019/07/27(土) 17:52:51.11
ttp://https://web.archive.org/web/20190727084527/https://toyokeizai.net/articles/-/293979?page=2
東洋経済の記事で未保存記事を1ページ目を保存して、1ページ目のアーカイブから2ページ目のリンクを開くと
保存されていないから当然保存用のリンクが表示されるけど、2ページ目のアーカイブから3ページ目のリンクを
クリックすると2ページ目のアーカイブが再度表示される。
以前だったら連続で保存できたのにできなくなって直接SavePageNowに打ち込むしかなくなったっぽい。
名無しさん@お腹いっぱい。 [] 2019/07/27(土) 17:53:37.41

具体的にこれ
459 [sage] 2019/07/27(土) 18:55:41.10
ttp://https://toyokeizai.net/articles/-/293789
ttp://https://toyokeizai.net/articles/-/294305
この 2 つを Internet Archive の入力欄に突っ込んでやってみたけど、
どちらも先頭から最後のページまで、"This page is available on the web!" を経て保存できたけどなぁ。
ttp://https://web.archive.org/web/20190727093955/https://toyokeizai.net/articles/-/293789
ttp://https://web.archive.org/web/20190727094921/https://toyokeizai.net/articles/-/294305
どうもこちらでは現象が再現できない。
名無しさん@お腹いっぱい。 [sage] 2019/07/31(水) 16:56:51.69

もう一回試してみたけど、また同じ症状になった。page=2が再表示。駄目やん
Firefoxアプデ放置してたのが原因かと思って、他のタブ閉じたりしてしばらくたったところで
アプデ前にもう一回挑戦したら、何故かpage=3も保存できた。あれ?できた。どうなってるんだ?
名無しさん@お腹いっぱい。 [sage] 2019/07/31(水) 21:58:16.17
archive.todayまったく繋がらないけど同じ状況の人いませんか?
名無しさん@お腹いっぱい。 [sage] 2019/07/31(水) 22:03:00.21
問題なし
名無しさん@お腹いっぱい。 [sage] 2019/08/04(日) 23:29:04.15

Heritrixの仕様か何かなのかな?
自前でHeritrix動かしたことないから断言は出来ないけど
名無しさん@お腹いっぱい。 [sage] 2019/08/07(水) 05:57:03.34
/save/の調子がおかしい
名無しさん@お腹いっぱい。 [sage] 2019/08/07(水) 10:04:06.93
Chromeにしたらできた。ブラウザの問題か?
名無しさん@お腹いっぱい。 [] 2019/08/09(金) 14:25:43.54
5ch全体がまた長い時間落ちてたな…
ttp://i.imgur.com/ngUfu0Q.jpg
ttp://i.imgur.com/ZvEQ11t.jpg

で当サイトも13時前後にこうなってた
(幸い今は元に戻ってるが)
ttp://i.imgur.com/DgoOPBq.jpg
ttp://i.imgur.com/0C7H9LH.jpg
名無しさん@お腹いっぱい。 [] 2019/08/10(土) 13:00:17.06
ひょっとしたら改悪が行われたか?

以前ならば、(うまく説明できないが)例えばニュースサイトならば、
本記事以外の近隣記事なり参照記事のURLをクリックすると、
取得前のものについては、新規の取得を促す画面が出ていた。

これが大量に記事を取りたい場合には、非常に助かっていたのだが…

ところが昨日からは、上記と同じ動作を行うと、そういう画面が出なくなった。
代わりに出てきたのがこれ↓
ttps://i.imgur.com/2mOTHmt.jpg

そのため、いちいち一つずつ「Save Page Now」の部分に
URLを打ち込んで、対処している状態だが…。
やっぱりどうにも面倒くさい。

「This page is not available on the web」「because of server error」
ということは、一部のサーバーが動いていないのが原因で、
それさえ治れば、先に触れた機能も復活するのか?

このままでは仕事量が多くなる一方だから、何とかしてほしいんだが。
名無しさん@お腹いっぱい。 [sage] 2019/08/10(土) 17:11:05.47
の別パターン

ttps://i.imgur.com/4oyCI9z.jpg
471 [sage] 2019/08/10(土) 17:16:33.62
因みにとはメッセージが異なる。

「The Wayback Machine has not archived that URL.」

「This page is not available on the web」
「because request is invalid」
214 [sage] 2019/08/10(土) 20:23:49.05

それ、起こるサイトでは以前から発生しているけどなぁ。

> そのため、いちいち一つずつ「Save Page Now」の部分に
> URLを打ち込んで、対処している状態だが…。

アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
面倒なことには変わりは無いが。

せっかくブラウザにブックマークツールバーを出してるんだったら
強制保存させるブックマークレットを登録してしまえ。
ttps://pastebin.com/NA4c5krN
名無しさん@お腹いっぱい。 [sage] 2019/08/10(土) 20:57:03.82
ほーんそんなことできるやね
名無しさん@お腹いっぱい。 [sage] 2019/08/11(日) 16:13:46.46

>それ、起こるサイトでは以前から発生しているけどなぁ。

東京スポーツの公式サイトのうち「バックナンバー(本日の紙面)」に関しては、
こうした現象を確認していたんだが 、本当にあるとすればそのくらいで、
いきなり対象となる範囲が広がってしまった印象。

>アドレスバーの /web/日付時刻数字/ を /save/ に変えるだけでは駄目なのか?
>面倒なことには変わりは無いが。

これを試してみたけど、幾分作業が楽になった。これ、しばらく続けてみます。
本当にありがとうございます。
名無しさん@お腹いっぱい。 [sage] 2019/08/11(日) 18:37:46.76
Twitterも最近その現象になってしまったな
アーカイブ先への負荷対策とかなんかね
名無しさん@お腹いっぱい。 [sage] 2019/08/17(土) 00:10:57.04
の症状は今は直っているぽい
名無しさん@お腹いっぱい。 [sage] 2019/08/17(土) 13:08:01.08
に関しても、元に戻ったみたいだ(新規取得を促す画面が復活)。

とはいえ最下段のブックマークレットは、使ってみたら
結構便利なので、しばらく併用ということで。


ところでchromeはともかくとして、先日からIEではかなり使い辛くなった。

保存の後、以前なら左上隅のロゴマークをクリックするとトップページに戻っていたのが、
なぜか違うページに飛ばされるようになった。
上方に四角形がいくつか並んでいるのと、小さな英文が表示されたページだが、
その四角形は関連サイトへのリンクらしく、左端の四角形をクリックすると、
やっとこさ当サイトのトップページに戻ることができた。

さらに言えば、「BROWSE HISTORY」(過去の保存リストが表示される画面行き)が
IEでは使えなくなってしまってる。
名無しさん@お腹いっぱい。 [sage] 2019/08/19(月) 18:42:22.44
IEだと使いづらいね。過去のキャプチャ一覧も見られなくなったし。
Microsoft Edgeなら問題なく見られるから今後はEdgeで見ようかな
名無しさん@お腹いっぱい。 [sage] 2019/08/19(月) 21:28:32.19
直リン禁止サイトの画像がキャプチャできないっぽい
214 [sage] 2019/08/20(火) 00:08:02.41

元々そういう仕様。

/save/ を使って保存させたとき、ブラウザから Internet Archive へ送られた
リクエストヘッダ類 (俗に環境変数と呼ばれているやつ) は
一部の改変・追加のみで元サーバへ送られるので、
これを偽装することによって直リン回避は可能。
リファラーのみチェックしているサイトについては、やったことがある。

ただ、同一の URL について複数の日付のアーカイブが存在しているときに、
自分が /save/ したものだけ画像あり、他人が /save/ したものは画像無し、
ということになるのであまり実用性は無いと思う。
名無しさん@お腹いっぱい。 [sage] 2019/08/20(火) 04:06:07.29

何が悲しくって未だにIE使ってるの?
MSももはやサポート放棄しようとしてるのに
名無しさん@お腹いっぱい。 [sage] 2019/08/20(火) 04:09:28.55
Internet Archiveがどうかは分からないけど、最近のサイトは面倒なIE対応を放棄してるところも多いし、
悪いこと言わないからEdgeとかChromeとかFirefoxとかに乗り換えた方が良い
というかIAも長くてあと2,3年でIEじゃちゃんと見れなくなると思うぞ
名無しさん@お腹いっぱい。 [sage] 2019/08/20(火) 11:55:38.40
IEだとまったく使い物にならなくなっていたのか。
検索かけて原因見てもだれも指摘してないので調べたら、5chのこのスレでようやく原因判明

クローム使えってか。たしかにweb.archive.org/web/*/ の保存一覧がちゃんと出るようになった

見られないからwebarchiveに無駄に垢とっちゃったよ消したい・・・・
名無しさん@お腹いっぱい。 [sage] 2019/08/20(火) 17:01:34.51

図書館などの公共施設のパソコンだと、
いまだにブラウザといえばIEしか用意されてない。
名無しさん@お腹いっぱい。 [sage] 2019/08/21(水) 01:38:06.53
IEは業務決め打ちシステム用が多くて下手に改変もできないが無視して捨てるわけにもいかないがんじがらめ状態なんだろうな
名無しさん@お腹いっぱい。 [sage] 2019/08/21(水) 19:32:31.80

ありがとう。Referer ControlをInactiveにしたら画像もキャプチャできた。
名無しさん@お腹いっぱい。 [] 2019/08/31(土) 13:21:10.56
こんな表示初めてだ
ttps://i.imgur.com/qHAOEdh.jpg
名無しさん@お腹いっぱい。 [] 2019/08/31(土) 13:23:41.39
429 Too Many Requests
You have sent too many requests in a given amount of time.

…ありゃスレもあがってないや
名無しさん@お腹いっぱい。 [sage] 2019/09/03(火) 11:14:03.82

これ俺だけじゃなかったのか
てっきりアーカイブし過ぎたせいかと
名無しさん@お腹いっぱい。 [sage] 2019/09/03(火) 17:20:01.26
ここ数日
すぐに結果が表示されずに
画面が真っ白になる現象が起きている

今のところ少し時間を置けば普通の状態になるので
使えはするが何だか謎
名無しさん@お腹いっぱい。 [sage] 2019/09/03(火) 23:12:39.81

同じく。

トップにしかアクセスできない。
ブラウザによってはトップすらアクセスできず。
名無しさん@お腹いっぱい。 [] 2019/09/03(火) 23:53:16.60

スクショをJPEGで上げてる時点で程度が知れてる
名無しさん@お腹いっぱい。 [sage] 2019/09/04(水) 00:05:55.93
激重だな
名無しさん@お腹いっぱい。 [sage] 2019/09/05(木) 02:32:15.75
ようやくトップ以外にもアクセスできるようになった。
名無しさん@お腹いっぱい。 [sage] 2019/09/06(金) 17:35:27.43

URL検索がずっと死んだままで特定サイトの年代別アーカイブが探りにくい

検索エンジンも昔はサクサクで一覧出てきたのが、何年か前にUIがリニュされてから、ずっと激重で不便極まりなかったけど…
名無しさん@お腹いっぱい。 [sage] 2019/09/06(金) 18:04:08.37

Chromeも古い端末だと最終verでも駄目だね。

Edgeが使えるぐらい新しい機種でないと…
名無しさん@お腹いっぱい。 [] 2019/09/07(土) 17:00:08.96
ピザ
名無しさん@お腹いっぱい。 [sage] 2019/09/07(土) 23:07:16.12
ピザピザ
名無しさん@お腹いっぱい。 [] 2019/09/09(月) 21:12:02.33
30分ほど前からサイトにつながらない
名無しさん@お腹いっぱい。 [sage] 2019/09/09(月) 21:26:42.32
こっちは普通に問題なく繋がってる
今もSave Page Nowでいくつか保存してきた
ベータ版SPNのSave outlinksってオプションを初めて使ってみたがめちゃくちゃ便利だな
名無しさん@お腹いっぱい。 [sage] 2019/09/09(月) 22:06:55.46
なにそれ
もしゃあして全部保存してくれるの
名無しさん@お腹いっぱい。 [] 2019/09/10(火) 06:26:29.17


> ベータ版SPNのSave outlinksってオプション


知らない
名無しさん@お腹いっぱい。 [] 2019/09/10(火) 06:31:20.60
ベータ版SPNのSave outlinks 

いま試してみたが、ヤフーニュースはやっぱり魚拓とれなかった。
名無しさん@お腹いっぱい。 [] 2019/09/10(火) 14:26:32.65
海外のブックマークサービスと魚拓サービスのリスト
ttp://https://github.com/pirate/ArchiveBox/wiki/Web-Archiving-Community
名無しさん@お腹いっぱい。 [sage] 2019/09/10(火) 14:53:20.34

アーカイブが取れて無いのと、例のページ遷移スクリプトが発動してるだけなのと
どっちなんだ
501 [sage] 2019/09/10(火) 16:04:06.39
Save outlinksってのは、SPNに投げたURLのページに貼られてるリンク先も全て読み込んで保存してくれるオプション
さすがに無制限にリンクを辿る訳ではなくて1段階しか辿ってくれないけど、それでもかなり手間が省ける
遷移スクリプトの発火をキャンセルしてくれるような機能はおそらくないと思う
501 [sage] 2019/09/10(火) 16:23:18.90
ここから使える
ttp://https://web.archive.org/save
名無しさん@お腹いっぱい。 [] 2019/09/10(火) 17:21:54.72



今までインターネットアーカイブでヤフー関連のページの魚拓を
取ってもヤフートップに飛ばされた魚拓しか表示されなかったので
ここでは魚拓は取れないものと思っていたが、実は取れていたと知
恵袋に書いてあった。
ttp://http://superbabooooo.blog.jp/archives/27043737.html
名無しさん@お腹いっぱい。 [sage] 2019/09/10(火) 17:43:04.48
またクソ重になってら
他だと取りにくいページもあるのに
名無しさん@お腹いっぱい。 [sage] 2019/09/10(火) 17:50:40.56
確か/web/1/が最古、/web/2が最新のアーカイブなんだよね
これ以外に隠しコマンドというか隠しエンドポイント的なURLはあるの?
名無しさん@お腹いっぱい。 [sage] 2019/09/10(火) 18:26:40.26
/0/は?
名無しさん@お腹いっぱい。 [sage] 2019/09/10(火) 19:08:38.46

初耳だったのでexample.comで試してみたが最古のものが表示された
/1/と同じなのでは
名無しさん@お腹いっぱい。 [sage] 2019/09/11(水) 01:13:51.29
/1996/は?
214 [sage] 2019/09/11(水) 13:00:53.66

/web/年/ とか /web/年月/ とかは、現在の UI が Beta から本導入となった時に廃止された。
今でもエラーとはならないものの、数字の意味する通りには動かなくなっている。


数字の後ろに付ける、コマンドみたいなものは前スレでほぼ挙がっているから、
いわゆる文字化け騒動以降のレスに一通り目を通しておくと良いと思う。
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 02:32:02.83
ふむ
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 03:00:49.41

情報ありがとう
主なものをまとめるとこんな感じだろうか、間違いや抜けがあったら教えてくれ
(全てttp://https://example.comで利用可能なのは検証済み)
/save/:保存
/web/*/:アーカイブ一覧表示
/web/1/:最古のアーカイブ
/web/2/:最新のアーカイブ
/web/日付時刻数字fw_/:時系列・クローラー情報の非表示(文字コード変換あり)
/web/日付時刻数字id_/:アーカイブ時の生ファイル(文字コード変換なし、HTMLコード内のURLの置換も行われない)

こちらも参照のこと:ttp://https://en.wikipedia.org/wiki/Help:Using_the_Wayback_Machine#Specific_archive_copy
まだ情報を精査出来てないけどここも参考になりうるかも:ttp://https://github.com/iipc/openwayback/wiki
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 03:03:53.26
新しいSPNのSave outlinksなどのオプションのオンオフ情報はやはりHTTPリクエストの中に含まれてるのかな
このオプションを使った/save/を自動化できたらいいんだが
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 03:09:00.47
どうでもいいことだが、前スレに比べるとこのスレは書き込み数がだいぶ多いな
何かのきっかけで人口が増えたのかもな
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 03:15:09.71
個人Webスペースが消える一方だからな
名無しさん@お腹いっぱい。 [] 2019/09/12(木) 06:36:52.72


ヤフーブログやヤプログまで消滅するからな。
名無しさん@お腹いっぱい。 [] 2019/09/12(木) 11:08:25.50

ここ2〜3日おかしいね。
使える時もあるけど、すぐに息切れするかのように
アクセス不可になってしまう。

瞬時に見出しや内容を変えかねないニュースサイトについては、
他が調子が悪かったり、動作のスピードがゆっくりになった分、
ここのサイトがぴったりになってるが、ここもダメになったら本当に痛い。
名無しさん@お腹いっぱい。 [] 2019/09/12(木) 19:20:26.85
魚拓界という言い方があるかは知らないが、
今年は受難の年だなあ。
名無しさん@お腹いっぱい。 [sage] 2019/09/12(木) 21:34:02.49
釣りに引っ掛かりやすそうやつばかり住んでそうな界だな
名無しさん@お腹いっぱい。 [sage] 2019/09/13(金) 00:44:04.97
自分の環境ではここ数日の間も普通に保存できてるから受難とか言われてもあまりピンと来ない
名無しさん@お腹いっぱい。 [sage] 2019/09/13(金) 00:48:04.43
自分はいつアクセスしても特に何事もなく保存できているが、不安定で使えないという人もいるのか
回線か時間帯かマシンかブラウザかサイト特有の問題かはたまた別の何かか、何がおかしいんだろうな
名無しさん@お腹いっぱい。 [sage] 2019/09/13(金) 14:33:47.72
使っていくうちに後になって「アクセス不可」と返してきたり
昨日などは一日中動きが固くなった末やっと画面が変わったら「アクセス不可」
と本当に様々だが

自分にとっては必要なんだよ
誰も新聞社のニュースサイトなんて取ってねえから
環境によって使えませんという話なら誰か自分の代わりにやってほしいわ…
名無しさん@お腹いっぱい。 [sage] 2019/09/14(土) 11:22:10.85
どこの新聞社のサイトなんよ
URL分かれば多少は手伝いようがある
名無しさん@お腹いっぱい。 [sage] 2019/09/14(土) 14:39:00.18
時間が経つにつれ必然的にアーカイブの重要性は増していくので
IAには頑張ってほしいね
名無しさん@お腹いっぱい。 [sage] 2019/09/15(日) 03:19:48.19
何かの間違いで消滅したら一番ショックなサイトな気がしてきた
名無しさん@お腹いっぱい。 [sage] 2019/09/16(月) 11:52:43.11
今is共々落ちてる
同時に落ちたらなんにも出来なくて困る・・・
名無しさん@お腹いっぱい。 [sage] 2019/09/16(月) 15:43:35.10
14〜15日に取った分消えてる!?
名無しさん@お腹いっぱい。 [sage] 2019/09/16(月) 17:47:56.69
お世話になります
名無しさん@お腹いっぱい。 [sage] 2019/09/17(火) 18:37:03.69

稀によくある
数日経った後に反映される
名無しさん@お腹いっぱい。 [sage] 2019/09/18(水) 00:05:26.20

まさに稀によくあるの好用例すぎるw
あの図解を思い出せる


●●●●●●●
●●●●●●●
●●●○○○○
○●●●●●●
●●●
名無しさん@お腹いっぱい。 [sage] 2019/09/19(木) 22:53:33.55
現在また取得不可能に
名無しさん@お腹いっぱい。 [] 2019/09/21(土) 13:13:25.89
最近の人ってInternetArchiveって知ってるんだろうか
名無しさん@お腹いっぱい。 [sage] 2019/09/21(土) 13:21:52.78
どういうことよ
名無しさん@お腹いっぱい。 [sage] 2019/09/21(土) 23:54:10.27
知らない年長者も多く見かけるし、知ってて活用してる若者も多く見かける
老いも若きも関係なく、知ってる人は知ってるし知らない人は知らないんだと思う
名無しさん@お腹いっぱい。 [] 2019/09/23(月) 02:12:26.72

id_のコマンドを初めて知ったがすごく便利だなこれ、thx
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 11:18:16.68
30分くらい前から、5chのスレッドや、imgurの画像が
ハネられるようになったな。


分かるなあ。
「魚拓を取る」という行為自体が、まだまだ一般的ではないんだよな。
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 14:20:55.70
twitterとか見ると発言の証拠にスマホのスクショ使ってるのをよく見るよね
あんなんやろうと思えばいくらでもいじれるのに…
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 14:47:07.74
このスレには未だにスクショをJPEGで貼る奴が・・・
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 15:42:33.91

アニメ板とかだとこだわるんだろうか
スクショの目的の多くは再現性では無いと思うから別にファイル形式はどうでもいいのでは
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 18:49:14.06
ttps://i.imgur%2ecom/HaVSm1Gb.jpg
名無しさん@お腹いっぱい。 [sage] 2019/09/24(火) 19:07:47.61

>「魚拓を取る」という行為自体が、まだまだ一般的ではないんだよな。
同感だわ
過去の文書や書籍を将来のために保管するのが大事だって意識自体、日本では今ひとつ根付いてない
(どこかの地方図書館が入り切らない蔵書を焼却処分したという最近のニュースが好例)
昔からある紙の資料ですらそんな扱いなんだから、Webアーカイブを取るという意識が根付いているはずもないわな

それにしても、スクショのファイル形式がjpegだとなんか問題があるの?
確かにアニメのキャプとか高い画質が要求される種類の画像なら確かにダメだろうけど
名無しさん@お腹いっぱい。 [] 2019/09/25(水) 01:58:43.16
学校でweb魚拓の存在を解説するべきだと思うの
名無しさん@お腹いっぱい。 [sage] 2019/09/25(水) 03:23:56.97
若いって良いなぁ
名無しさん@お腹いっぱい。 [sage] 2019/09/25(水) 23:52:11.76
人が押し寄せて余計重くなったらどうする
名無しさん@お腹いっぱい。 [sage] 2019/09/27(金) 16:39:51.22
既に重いんだから多少人が増えたってどうせ主観的な重さ具合は変わらんだろ
少しくらい重くてもアーカイブが増えた方がいい
名無しさん@お腹いっぱい。 [] 2019/09/28(土) 23:22:06.24
はじめまして。無知ですがすみません。

もう何日もこのインターネットアーカイブ(ttp://http://web.archive.org/
どんなURLを入れても、何も出来ないです。
トップも前まであったURLいれる欄がなくなって(右上のsearchならある)、おかしな文出てるし。

↓トップはURLいれる欄がなくなり、こういう文だけ出てますが、英語わからないので日本語訳してもわけわかりません。


(The Wayback Machine is an initiative of the Internet Archive,a 501(c)(3) non-profit, building a digital library ofInternet sites and other cultural artifacts in digital form.
Other projects include Open Library & archive-it.org.
Your use of the Wayback Machine is subject to the Internet Archive's Terms of Use. )


右上から何のURL検索してみても、日付のも出て来ずにこのトップ文のままです。


でもスマホからなら前みたいに普通に検索出来ることを、スマホからやって、たった今知りました。でもどうしてもパソコンから見たいので。


何日もパソコンからインターネットアーカイブ出来ないのですが、スマホからなら出来るので、
出来ないのはうちのパソコンからだけなのか気になってます。
これはどういうことなのかわかる方いらっしゃいませんか。無知なのですみません。
214 [sage] 2019/09/29(日) 00:28:09.44
「ブラウザが古い、ないしサポート外」に一票。
ttps://i.imgur.com/ir0AFD6.png

以前 Windows 2000 で頑張っていた人 () を思い出す。
名無しさん@お腹いっぱい。 [sage] 2019/09/29(日) 01:08:34.37

古いブラウザ使ってませんか?
名無しさん@お腹いっぱい。 [sage] 2019/09/29(日) 01:10:24.76

同感
スマホでは見れるって事からもサポート外の古いブラウザのせいという感じがする
名無しさん@お腹いっぱい。 [sage] 2019/09/30(月) 17:16:34.34
【ヤフー】Yahoo!ブログ【アーカイブ】
ttp://mevius.5ch.net/test/read.cgi/blog/1554380939/l50/

74 Trackback(774) 2019/09/30(月) 17:07:59.58ID:th5gp/Yr
Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、
web.archive.org/save のページから「Save outlinks」にチェックを入れて保存すると
どうもYahooのトップページに遷移されずにアーカイブできるみたいだ
さっき偶然発見して何回か試したけど今のところ全て上手く保存されてる
214 [sage] 2019/09/30(月) 18:20:55.67

> Internet ArchiveでYahooブログを保存すると遷移スクリプトが発火する話なんだけど、

ニュースとか知恵袋は yjsecure.js が埋め込まれてるが
ブログも埋め込みあったっけ?
名無しさん@お腹いっぱい。 [sage] 2019/09/30(月) 21:58:44.70
save outlinksってURLレベルでは指定できないの?
/save/みたいに/saveoutlinks/みたいなのはない?
名無しさん@お腹いっぱい。 [sage] 2019/09/30(月) 22:23:16.38

ヤフーブログにもyjsecure.jsがあるかは分からない
でも以前web.archive.orgトップページのSPNフォームから保存した時は何回やってもリダイレクトされたよ
向こうのスレでもそれが問題になってたみたいだね


おそらくない
ただHTTPリクエストにsave outlinksが有効かどうか指定するオプションはあった(ブラウザの開発者機能で確認した)
何とも言えないけどsave outlinksで保存するスクリプトを組める可能性はあると思う
558 [sage] 2019/09/30(月) 22:25:47.87
&#10005;何とも言えない
○断言はできない
558 [sage] 2019/09/30(月) 22:36:04.34
確認してきた
確かにYahooブログにもyjsecure.jsが埋め込まれてるね
ttp://https://s.yimg.jp/images/security/pf/yjsecure.js ってリンクがどのブログにも入ってた
558 [sage] 2019/10/01(火) 01:08:39.74
少し実験して分かったこと
・少なくともYahooブログの場合、yjsecure.jsはモバイル版表示の時のみ発動する(と思われる)
・web.archive.orgトップページのSPNフォームをモバイル端末(スマホやタブレット)のブラウザから使うとモバイル版表示で保存される
・/save/のsave outlinksを使うと利用デバイスに関係なくデスクトップ表示で保存される(と思われる)
214 [sage] 2019/10/01(火) 02:05:43.05

> ・少なくともYahooブログの場合、yjsecure.jsはモバイル版表示の時のみ発動する(と思われる)
あぁ、道理で見つからなかった訳だ・・・。

気になったので、診断くん ttp://http://taruo.net/e/ をアーカイブさせてみた。
ttp://http://web.archive.org/web/20190930162118/taruo.net/e/
HTTP_USER_AGENT の行に注目。多分これだなぁ。
通常の /save/ を使うと、操作を行ったブラウザ名がそのまま相手先へ送られる。
ところが件の新機能を使うと、別の名前が送られる模様。
Firefox を使ったのに、それが一切現れていない。

つまり、新機能を使うとブラウザ名が隠されるので、
モバイルブラウザ向けに特別な動作をするサーバであっても、それが行われない。
Yahoo! ブログの場合、yjsecure.js を含まないデスクトップ向けのコードが出力される。
こういうことではないかと。
技術的な説明は省略。
名無しさん@お腹いっぱい。 [sage] 2019/10/01(火) 02:12:35.52
なるほどなあ
名無しさん@お腹いっぱい。 [sage] 2019/10/01(火) 14:58:12.98
(そもそもTOPページに飛ばすという仕様いる...?)
名無しさん@お腹いっぱい。 [sage] 2019/10/01(火) 16:16:15.14
楽天かどっかで「あなたが見ているドメインは楽天じゃないよ!」みたいなエラーは出たりするなあ。
何かの詐欺で部品だけ呼び出してつかわれたりすることがあるんだろうか。
名無しさん@お腹いっぱい。 [sage] 2019/10/03(木) 16:23:07.36
ところでrom-setは合法なの?
堂々と配布してるが大丈夫なのか
名無しさん@お腹いっぱい。 [sage] 2019/10/03(木) 19:50:57.28
rom-setが何なのか検索しても今ひとつ分からなかったが、
もう販売されてない古いゲームのROMのことなら米国法のフェアユース規定で守られてるのではと予想
名無しさん@お腹いっぱい。 [sage] 2019/10/03(木) 21:17:15.71
最近Bummer多いな
リロードすれば普通に取れるけど
名無しさん@お腹いっぱい。 [] 2019/10/03(木) 21:48:36.34


> リロードすれば普通に取れるけど


なにげに気がつかなかったよw
名無しさん@お腹いっぱい。 [sage] 2019/10/04(金) 04:12:52.03
Too Many Requestsも頻発するな
名無しさん@お腹いっぱい。 [sage] 2019/10/04(金) 14:04:28.50
スクリプトは時間長くしとけばなんとかなりそうだけど、手動で保存する時めんどい
名無しさん@お腹いっぱい。 [sage] 2019/10/04(金) 20:00:21.60

だいたい3件以上
同時に取ろうとすると出てくるな

正直鬱陶しいのだが…
名無しさん@お腹いっぱい。 [sage] 2019/10/04(金) 20:20:06.76
ハウメニー?
名無しさん@お腹いっぱい。 [sage] 2019/10/05(土) 15:58:39.89
日本語URL(というかアルファベット以外?)だと挙動がおかしくなるのどうしようもないのかな
名無しさん@お腹いっぱい。 [sage] 2019/10/06(日) 17:12:51.36
Too Many Requests
Please email info@archive.org if you have questions about why are you being blocked

…もう、冗談抜きでいい加減にしてほしいよ。
もはやここしか頼るところがない、といっても過言ではないのに。

で、上に掲げた文の下段は、どういう意味?
ブロックに関しての質問はこちらまで、というだけか?
名無しさん@お腹いっぱい。 [sage] 2019/10/06(日) 21:02:22.74
今のところToo Many Requestsで怒られた事ないんだが、どのくらいの頻度で何回くらいやると出てくるものなの?
名無しさん@お腹いっぱい。 [sage] 2019/10/06(日) 22:24:15.60
俺もToo Many Requests出るな
感覚としては3~5連続で取ると出る、が出ないときは出ない
単純にサーバー側の問題な気がする
214 [sage] 2019/10/07(月) 21:48:35.31

> 感覚としては3~5連続で取ると出る、が出ないときは出ない

ベースとなる HTML だけでなく、個々のファイル単位ではどうでしょう。
HTML が保存できても、そこで使われている画像等を保存するために
副次的に発行される /save/ リクエストが Too Many Requests となってしまい、
結果としてそれらを取りこぼす、なんて事態が発生し始めたように思えます。

このエラーメッセージ、語順がちょっと変な上に文末のピリオドを忘れていて、
Internet Archive であまりこういう英文を見ることが無いので違和感がありますね。
名無しさん@お腹いっぱい。 [sage] 2019/10/08(火) 11:06:26.40

ごめん、個々のファイルまでは見てないから分からない
表示が出るようになったのは最近

語順に関しては、IAは割とそういう適当な所があるような気もするw
名無しさん@お腹いっぱい。 [sage] 2019/10/08(火) 15:56:29.37
この語順そんな変か?
ピリオドがないのも、この手のエラーメッセージの場合はそこそこあると思うけどな
名無しさん@お腹いっぱい。 [sage] 2019/10/09(水) 19:13:13.16

ということは、今後IAについても、
ウェブ魚拓に見られるような、
画像(写真など)の抜け落ちが出てきそうってこと?
何かそれも嫌だなあ
名無しさん@お腹いっぱい。 [sage] 2019/10/09(水) 19:41:48.03
Twitterの埋め込みがきちんと保存されないのが個人的に一番困ってるんだけど、この現象って以前からなんだろうか
名無しさん@お腹いっぱい。 [sage] 2019/10/10(木) 20:49:37.09
Save Page Nowの仕様変更をいくつか確認した
・web.archive.orgトップのSPNフォームで保存ボタンを押すと一旦/save/に誘導されるようになった
・/save/のオプションに「Save screen shot」が加わった
→有効にすると「/web/日付時刻数字/ttp://http://web.archive.org/screenshot/https://example.com」の形式でスクショ画像が保存される
→Save outlinksとの併用も可能だがリンク先のスクショは取得してくれないっぽい
名無しさん@お腹いっぱい。 [sage] 2019/10/10(木) 21:05:30.27

archive.todayみたいなアレか
名無しさん@お腹いっぱい。 [sage] 2019/10/10(木) 23:47:38.64
スクショいいな
動的なサイトでも一応取れる
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 01:21:38.88
うちのローカルでレンダリングしたやつになるのか?
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 11:15:07.84

厳密にはちょっと違うかもしれない
Wayback Machineのスクリーンショット機能は単なる画像ファイルとして保存される
対してarchive.todayやウェブ魚拓は一応HTMLコンテンツとして保存するから、リンクなどは一応機能する
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 11:25:19.46

おそらく違う
User Agentをめちゃくちゃな文字列にした上で、上の方で出てたプロキシ確認サイトをスマホのFirefoxからアーカイブしてみた
ttp://https://web.archive.org/web/20191011021858/http://taruo.net/e/
見れば分かるけど、使用したブラウザの情報がUAも含めて別の内容に置き換わってる
おそらくweb.archive.orgのサーバ側の情報なんだと思う
ヘッドレスブラウザか何かを使ってるのかも
名無しさん@お腹いっぱい。 [] 2019/10/11(金) 18:56:09.01
どういうことなの
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 19:25:43.75

これは忘れてないよな、念のため。
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 19:54:20.66
Too Many Requestsがマジで鬱陶しい

ほんとにニーズを分かって言ってんのか!?と言いたくなる
名無しさん@お腹いっぱい。 [sage] 2019/10/11(金) 20:58:38.55

それは分かってるから大丈夫
でもInternet Archiveの方にはスクリーンショットと普通のアーカイブを簡単に切り替える機能がないっぽいからな
比較の対象にはならないような気もする
名無しさん@お腹いっぱい。 [sage] 2019/10/12(土) 01:10:01.25
所詮IAはアメリカ人様の物で日本人の物ではない。そこはわきまえるべき。
日本でも公正利用の概念を法律化するしかない。
名無しさん@お腹いっぱい。 [] 2019/10/12(土) 09:22:47.74
台風で軒並みあらゆる施設が臨時休業の最中だが、
うおーい、「Too Many Requests」に添付された文章が変わったぞ!
ttps://i.imgur.com/Cy8ibMt.jpg


Too Many Requests

We are limiting the number of URLs you can submit to be Archived to the Wayback Machine, using the Save Page Now features, to no more than 15 per minute.
If you submit more than that we will block Save Page Now requests from your IP number for one day.

Please feel free to write to us at info@archive.org if you have questions about this. Please include your IP address and any URLs in the email so we can provide you with better service.
名無しさん@お腹いっぱい。 [sage] 2019/10/12(土) 12:04:20.05
な、なんだこれは…

ttps://i.imgur.com/oRVI9Gz.jpg

ttps://i.imgur.com/ir0PVkX.jpg
名無しさん@お腹いっぱい。 [sage] 2019/10/12(土) 17:50:17.15

google翻訳 
> リクエストが多すぎる
>
> [今すぐページを保存]機能を使用して、Wayback Machineにアーカイブするために送信できるURLの数を1分あたり15個以下に制限しています。
> それ以上送信すると、(あなたの)IPアドレスからのSave Page Nowリクエストが1日間ブロックされます。
>
> これについて質問がある場合は、info @ archive.orgまでお気軽にご連絡ください。 より良いサービスを提供できるように、メールにIPアドレスとURLを含めてください。
「(あなたの)」だけ俺が付け足した
名無しさん@お腹いっぱい。 [sage] 2019/10/12(土) 19:59:49.32
各地域の避難情報を見れる自治体のURLがたまにしか見れないから
アーカイブ取って見ようと思ったがずっとbummer
名無しさん@お腹いっぱい。 [] 2019/10/12(土) 20:51:44.68
bummerってなんなん
名無しさん@お腹いっぱい。 [sage] 2019/10/12(土) 22:53:46.49

ベータ版としては割と前から実装されてたけど、つい数日前に正式版になった
色々オプションが付けられるようになったんよ
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 00:29:42.05
こういう時に魚拓が生きる
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 12:38:24.44

下手したらブロックもされるのか。
急いで大量に取るのも難しくなるんだな。困ったなあ。


確かにそうだが、1日辺り60回までだからな。
どこも慎重にやらないと駄目か。
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 15:44:29.87
InternetArchive側も限られた回線のリソースで全世界からのリクエストを受け付けないといけないんだから、多少のリミットは仕方ないよ
規模を考えると1分間に15個までならむしろ緩い方じゃないかな
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 16:09:30.72
今日100リンクほど一気にsaveしたけど20近くは一度に保存されるしブロックもされなかったけどな
HTTPリクエストに直後POSTしてる訳じゃないからかもしれないが
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 18:07:36.01

どういう風にsaveしたんよ
名無しさん@お腹いっぱい。 [sage] 2019/10/13(日) 21:28:38.59

ユーザースクリプトでttp://https://web.archive.org/save/とwindow.location.href結合してwindow.openしてるだけよ
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 00:17:00.17
一分15個か
覚えとこう
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 04:18:41.90
少ないように感じたけど、冷静に考えたら普通に十分だな
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 10:42:20.01
4秒に1個だから十分すぎるくらいだな
よほど大量のURLを数時間で処理したい場合ならもしかしたら足りないかもしれないけど、そんな状況はそうそうない
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 10:59:14.84

>よほど大量のURLを数時間で処理したい場合ならもしかしたら
>足りないかもしれないけど、

…正直言って自分はそれなんだよなあ。
だってデイリースポーツの公式なんて、ひとつのカテゴリーでも
記事を続々上乗せしていくものだから、トップが馬鹿みたいにコロコロ変わっていくのよ。
だから目を放した隙に、取りたかった状態と、魚拓の結果が異なることが本当に多い。

しかも同じように記事を上乗せしていくのを、中日スポーツも
やり始めたんで、非常に今困ってる。
スポニチや日刊みたいに、記事は追加してもトップはしばらく変えない
くらいがいいのだけど。
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 14:14:29.29
祝10000回
ttps://i.imgur.com/xXiIGJu.jpg
名無しさん@お腹いっぱい。 [sage] 2019/10/14(月) 14:29:56.82

目指すところがよく分からないから的外れなこと言ってるかもしれないが、
定期的に更新をチェックして、以前の状態と変更があったら/save/を投げるようなスクリプト組んだら?
611 [sage] 2019/10/15(火) 02:14:16.40

「的外れなこと言ってるかもしれない」ってのは
「定期的に更新をチェックして、以前の状態と変更があったら/save/を投げるようなスクリプト組んだら?」
というのがそちらにとっては的外れなコメントかもしれないって事ね
名無しさん@お腹いっぱい。 [sage] 2019/10/15(火) 13:03:29.51
新機能のスクショ、以前取ったやつが消えてるんだけど反映が遅いだけかな?
名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 01:14:03.99
通常時でも動作が不安定になることが少なくないから、新機能ということで余計に不安定さが増してるのかもな
念のために一応スクショを取得し直してみては
名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 07:28:29.61
キャプチャ数からみて明らかに保存できてるのにまずHm.を返すのはなんなんだ
名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 16:05:11.45
また不調で全然取得出来ない・・・
日本からのアクセスだけ弾いてるとかないよね?
この手のアーカイブ取得しまくってるのは日本人多いからとかで
名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 16:42:13.83

名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 21:33:46.55
・ブラウザが古い
・連投しすぎてて1日間のIPブロックを食らっている
・いつものシステム不調
好きな原因候補を選ぼう
名無しさん@お腹いっぱい。 [sage] 2019/10/16(水) 22:52:13.36
これの最新がとれねえ ttp://https://www.dworks-ent.com/
過去サイトが全然関係ないっぽくて噴く

関連 ttps://rosie.5ch.net/test/read.cgi/liveplus/1571227845/
214 [sage] 2019/10/16(水) 23:47:39.24

皮肉だなぁ。


変換すべき URL が HTML 内部に大量にあるため異常と判断され、
結果としてインデックスから外されているとか、そういう予感。
元のソースを見るとスタイルシートが <style> 要素で挿入されていて、
その中にフォント等の外部参照が 1000 個以上ある。
名無しさん@お腹いっぱい。 [sage] 2019/10/17(木) 01:07:43.43
やっぱ全然取得できませんわ
最新のurlを入力すると一週間前のアーカイブのurlに飛ばされる
名無しさん@お腹いっぱい。 [sage] 2019/10/17(木) 08:42:12.81
やってみた
スクショは全然ダメだったが普通のアーカイブは取れたと思う
ttp://https://web.archive.org/web/20191016233430/https://www.dworks-ent.com/
名無しさん@お腹いっぱい。 [sage] 2019/10/17(木) 10:47:01.15
first archiveかどうかの表示止めちゃったのかな
あれ割と好きだったんだが
名無しさん@お腹いっぱい。 [sage] 2019/10/17(木) 10:52:43.50

いや今度は表示されたわ
単に通信が悪かっただけか
名無しさん@お腹いっぱい。 [sage] 2019/10/17(木) 18:58:41.63
新しいSavePage、UserAgentが書き換わるせいかサイトのデフォルト言語が英語になってしまうな
まあ誰が取っても統一されるから良いといえば良いんだが
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 01:24:35.21
エラーだの警告文だので全然ページ取れない使えないサイトになってしまった・・・
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 01:56:42.98
さっきからまるで保存できないな
しばらく待つしかないようだ
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 09:24:59.82
昨日あたりからSave outlinksの調子もおかしいような
Save Page Nowフォームに投げたリンク元のURLのアーカイブは取れるけど、リンク先のは全然取れない
エラーも出ずにただワーキングカーソルが延々とぐるぐる回り続ける
回線速度やマシンスペックの問題ではないはずなんだけどな
数時間おきに間隔を空けて試してるが、やっぱり問題解消まで待つしかないのか
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 10:08:22.49
根気よくリトライしてdoneになったページも半日おいて確認してみたらズコーってのが高頻度発生
徒労感はんぱないんで安定するまでしばしのお別れ
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 14:56:56.60


自分も同じ現象になったけど、2日3日置いたらアーカイブされてたよ
表示上グルグル回ってるだけで内部的には取れてるのかも
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 17:14:03.81
数時間前のでもアーカイブ一覧を見ると全然残ってないのよね
いつか復活するだろうと取得し続けるけど精神的につらい
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 18:49:14.19
魚拓うつ
名無しさん@お腹いっぱい。 [sage] 2019/10/18(金) 21:24:19.73

どうしても心配ならAPIで確認すればいいよ
こっちはすぐに反映される
ttp://https://archive.org/help/wayback_api.php
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 00:06:59.69
ありがとう
でも試してみたら丸1日以上取得出来ていない模様・・orz
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 00:20:52.13
あまりにもエラー連発するからステータスコード毎に適宜リトライするようなスクリプト書いてたら調子良い時期に突入したらしく確認がとれねえ
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 01:18:09.60
/save/ttp://http://url~にアクセスすると/saveに飛ばされるのは新たな仕様ですか?
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 01:42:49.09
ttps://i.imgur.com/mi8lPHF.jpg
ttps://i.imgur.com/312FfjE.jpg

なんかもう訳分からぬ状況に突入してまっせ
とにかくページ・画像ともに先に進めやしない


もしかしたら自分はそれかもな…
先月辺りから取らなきゃいけないものが激増したから
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 01:53:56.45
業務じゃないんだろ?己を強迫するな力を抜け
ていうか不安定なIAの現状みても当分離れるのが正解
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 02:05:19.41
ウェイバックウェーイwww
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 03:11:39.38
余計な機能いらねーから少しでも軽くしてくれ
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 07:42:23.08
殆どのサイトやページが何回登録押しても一発で簡単には?取れないようになってる
寄付集めて何改悪してんだよ
最悪だよ、これならスクショ取った方がマシだ
名無しさん@お腹いっぱい。 [sage] 2019/10/19(土) 08:33:50.57

そうです
つい先日変更されたばかり


ブラウザのURL入力バーにweb.archive.org/save/ttp://https://example.comと直打ちしたら自分も「Wayback Exception」になった
単なる不具合かもしれないが、もしかしたら/save/のページからの入力のみ受け付ける仕様変更になったのかもな


チェックボックスのオプションのことかな
あれ便利だから個人的には重宝してるんだけど人それぞれか
642 [sage] 2019/10/19(土) 12:05:49.13

>直打ちしたら自分も「Wayback Exception」になった
今試したら問題なくsaveできた
やっぱり一時的な不具合だったみたいだ
名無しさん@お腹いっぱい。 [sage] 2019/10/20(日) 12:41:01.64
Summary機能死んでるな
名無しさん@お腹いっぱい。 [sage] 2019/10/20(日) 13:16:39.96
/save/ttp://http://url~→今まで通り保存
Save This Url→/saveに誘導
時々サーバーエラー返るけど保存できてるっぽいな
名無しさん@お腹いっぱい。 [sage] 2019/10/21(月) 03:54:27.94
Bummer出現率が10倍になった気がするわ
名無しさん@お腹いっぱい。 [sage] 2019/10/21(月) 18:40:59.09
前から1割以上出てた気がするんだがひょっとして出現率100%超えた?
名無しさん@お腹いっぱい。 [sage] 2019/10/21(月) 20:55:58.53
Bummer出現率はどうも環境や時間帯によって変わるっぽいからな
自分は体感で0.5~2%くらいだが、5割を越える人もいるらしい
名無しさん@お腹いっぱい。 [sage] 2019/10/23(水) 00:37:32.27

ありがとう 
17 Oct 2019で撮れてるのをこちらでも確認
名無しさん@お腹いっぱい。 [sage] 2019/10/23(水) 09:50:03.69
もっと積極的に寄付募っていいと思うんだけどな
Wikipediaなんてクソデカアピールしてるのに
名無しさん@お腹いっぱい。 [sage] 2019/10/23(水) 12:51:52.98
あのコーヒー高いやつか
名無しさん@お腹いっぱい。 [sage] 2019/10/23(水) 16:02:36.31
Wikipediaみたいなしつこい広告をされると却って寄付する気が失せるが、
Internet Archiveみたいに全く何も言ってこないと逆に心配になって寄付したくなってしまう
名無しさん@お腹いっぱい。 [sage] 2019/10/24(木) 12:46:11.33
Save outlinksで読み込んでくれるリンクは50個が限界みたい
外部リンクがいくつあろうと最大で50個しか読み込まれてない
まあ無尽蔵に外部リンクを辿ると大変なことになるから制限をかけるのは無理ないけどな
ただ読み込むリンクをどういう基準で選定しているのかが気になる、もしかしたらランダムなのかもしれない
名無しさん@お腹いっぱい。 [sage] 2019/10/25(金) 09:27:42.02
普通なら「先頭からパースして50個に達したら終了」とか、そんな感じで組むと思うけどな。
名無しさん@お腹いっぱい。 [sage] 2019/10/25(金) 16:28:24.43
ブラウザの履歴消すとweb.archiveで取った筈の履歴がweb.archiveから消えてる事が多いんだけど、
どうしたらいいんでしょう…?
名無しさん@お腹いっぱい。 [sage] 2019/10/25(金) 16:39:28.87
俺は専門家ではないが、それはたぶん別の話だな
名無しさん@お腹いっぱい。 [sage] 2019/10/25(金) 20:44:45.21
100%それで消える事はない
多分、カレンダー経由かアーカイブURL直打ちかの違いだと思うけど(カレンダーは反映が遅い)
名無しさん@お腹いっぱい。 [sage] 2019/10/25(金) 23:04:26.68
確かに100%ありえないな
これまで見れてたアーカイブがブラウザの履歴を消した後見れなくなったって言いたいんだと解釈したけど、
そういうことならWayback側のシステム不具合と履歴消去のタイミングが偶然重なったんじゃないかな
名無しさん@お腹いっぱい。 [] 2019/10/26(土) 01:26:02.18
あれ強制セーブどうやんだっけ
/save/にアドレス入れたとたん保存済みの古いページに飛ぶから現時点のが保存できん
名無しさん@お腹いっぱい。 [sage] 2019/10/26(土) 20:17:47.54

それ保存されているはずでは?
アドレスの日時は今現在の時刻になっているはず。
ただし日本の時刻とはズレている
名無しさん@お腹いっぱい。 [sage] 2019/10/27(日) 09:59:27.01
ああ騒がせてすまんかった やり方がよくなかったんだわ
ちゃんと保存されたのを確認
名無しさん@お腹いっぱい。 [] 2019/10/27(日) 19:18:43.25
.isが.phになった
名無しさん@お腹いっぱい。 [sage] 2019/10/27(日) 20:18:10.50
ヒィリピンか?
名無しさん@お腹いっぱい。 [] 2019/10/27(日) 20:43:47.15


そうだ
214 [sage] 2019/10/28(月) 21:12:51.70
18 日あたりからでしょうか、一部の古いブラウザへの対応が復活していますね。
全く使い物にならなくなっていた Internet Explorer 11 で
カレンダ画面が描画できていることを確認。
ttps://i.imgur.com/5XWVxdq.png
名無しさん@お腹いっぱい。 [sage] 2019/10/28(月) 21:44:28.72
IE11はサポート現役のブラウザだからな
そうでなくっちゃ
名無しさん@お腹いっぱい。 [sage] 2019/10/29(火) 00:40:26.39
Web開発やってるとIEはとにかく邪魔者でしかないんだけどな
個別対応とかが面倒だしセキュリティ上の懸念もある
IAもよくサポート復活したな、要望が多かったんだろうか
名無しさん@お腹いっぱい。 [sage] 2019/11/01(金) 01:10:39.55
「ぐっちゃぐちゃだけど一応使える」程度でも十分だよね
名無しさん@お腹いっぱい。 [sage] 2019/11/01(金) 15:13:44.89
相変わらず迷走中。ブロック期間を五分間に短縮。
名無しさん@お腹いっぱい。 [sage] 2019/11/03(日) 01:35:00.29
連投具合でブロック時間が変わるんだと予想
まあブロック時間が長くなるよりかはマシでしょ
名無しさん@お腹いっぱい。 [] 2019/11/04(月) 19:47:08.99
あげとくよ
名無しさん@お腹いっぱい。 [sage] 2019/11/04(月) 22:36:49.74
?ありがとう
名無しさん@お腹いっぱい。 [sage] 2019/11/05(火) 12:28:57.16
URLの末尾が「?」だとアーカイブが取れないバグ無いか?
正確に言うと勝手に「?」が取られて意図しないページが取得される

例えば
example.com/test?
をアーカイブしようとしても
example.com/test
となってアーカイブできない

対策としては適当なクエリを付ければアーカイブできる。上の例なら
example.com/test?hoge
とすれば取れる、URLは変わるけど...

クエリの開始点と誤認識してるのかな?
名無しさん@お腹いっぱい。 [sage] 2019/11/05(火) 14:10:24.24
これは参考になる
クリスタルひとしくんをあげたい
名無しさん@お腹いっぱい。 [] 2019/11/05(火) 15:27:44.29


> URLの末尾が「?」


そんなサイトがあるのか。知らなかったのだ。
名無しさん@お腹いっぱい。 [sage] 2019/11/05(火) 20:17:21.03

例えば
ttp://https://ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B%3F
とか
名無しさん@お腹いっぱい。 [sage] 2019/11/05(火) 20:23:08.46

パーセントエンコードされているのをデコードするマヌケ
名無しさん@お腹いっぱい。 [sage] 2019/11/06(水) 03:34:12.87
URLをエンコードして保存しないとそりゃそうなるわな
名無しさん@お腹いっぱい。 [sage] 2019/11/06(水) 11:12:10.74
そうですか、じゃあ保存方法を教えてくれ
ttp://https://web.archive.org/web/*/https://ja.wikipedia.org/wiki/ソウナンですか%3F
名無しさん@お腹いっぱい。 [sage] 2019/11/06(水) 18:26:38.28
自分で答え(符号化URL)書いてるのに気付いてないのか

っ web.archive.org/save/ttp://https://ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B%3F
名無しさん@お腹いっぱい。 [sage] 2019/11/07(木) 09:39:00.60
URL パーセントエンコーディング で検索
名無しさん@お腹いっぱい。 [sage] 2019/11/07(木) 16:38:16.92
不適切なページ名 - Wikipedia
ttp://https://web.archive.org/web/20191107073644/ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B%253F
名無しさん@お腹いっぱい。 [sage] 2019/11/07(木) 18:57:16.91
まあ?記号だけエンコードしてもそりゃ意味無いわな
URLの日本語部分全部をエンコードせな
名無しさん@お腹いっぱい。 [sage] 2019/11/07(木) 19:01:10.50
「URL パーセントエンコーディング」で検索して分からないならもはや絶望的だから諦めろ
214 [sage] 2019/11/07(木) 20:22:03.37

Edge なんかだと、location.href も document.URL も
decodeURI() された状態で入っていますからねぇ。
アドレスバーの中身をコピーした場合もまた然り。
ttp://https://ja.wikipedia.org/wiki/ソウナンですか%3F

まぁ同一ブラウザ内で単純に ttp://http://web.archive.org/save/ を頭に付けて
アドレスバーへ再投入するだけなら問題は起こらないとは思いますが。
名無しさん@お腹いっぱい。 [sage] 2019/11/07(木) 23:07:13.43
いや で自分で答え書いてるって
URLエンコードの理解以上に救いようがない
名無しさん@お腹いっぱい。 [] 2019/11/08(金) 20:42:41.32
Wayback Machine
いつの間にかヤフーニュースのスクリーンショットを取れるように
なっていた。
これだとヤフーのトップページに遷移されることもない。
Save screen shot  にチェックを入れてからクリック。
名無しさん@お腹いっぱい。 [age] 2019/11/08(金) 21:35:11.25
何を今更
名無しさん@お腹いっぱい。 [] 2019/11/09(土) 19:10:59.19
何か「attention request」とか出る(´・ω・`)
名無しさん@お腹いっぱい。 [] 2019/11/10(日) 14:47:45.08
午後から503が頻発すると思ったら
いきなりメンテナンスに突入
名無しさん@お腹いっぱい。 [sage] 2019/11/10(日) 17:47:38.07

もし良かったら取得できたURLを張ってくれないか?
本当に取れてるなら悪いがマウント取りたいだけにしか見えなくてな

↓のカレンダーでは青丸になってるが取れてない(エンコード有り無し両方)
ttp://https://web.archive.org/web/*/https://ja.wikipedia.org/wiki/ソウナンですか%3F
214 [sage] 2019/11/10(日) 19:24:48.83
個人的にまとめるとこんな感じかな。
末尾に ? (%3F) があると問題なのは間違いなさそう。

A) ttp://https://ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B%3F
B) ttp://https://ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B
A が本来の URL、B は間違い。

A は先頭に 〜/save/ を付けた URL にアクセスすると
暫くの間ウィキペのコンテンツが表示されるので、それが保存できているとは思う。

A のアーカイブ一覧、現在 10 件。
ttp://http://web.archive.org/web/*/ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B%3F
B のアーカイブ一覧、現在 2 件。
ttp://http://web.archive.org/web/*/ja.wikipedia.org/wiki/%E3%82%BD%E3%82%A6%E3%83%8A%E3%83%B3%E3%81%A7%E3%81%99%E3%81%8B
これらのカレンダ表示は、おそらく正しい値ではないかと思う。

ところが A の個別のアーカイブを開こうとすると、
なぜか B の個別のアーカイブにリダイレクトされてしまう。
名無しさん@お腹いっぱい。 [sage] 2019/11/10(日) 20:52:53.22
web.archive.org のバグだね
本来エンコード済みなら無視しちゃいけない末尾の%3F (?) を無視しちゃってる
名無しさん@お腹いっぱい。 [] 2019/11/11(月) 01:49:34.32
またなんか挙動がおかしいな
保存完了したから確認しようとすると「セーブしますか?」のページに飛ぶ
ドメインから引こうとしても1個もヒットしない
名無しさん@お腹いっぱい。 [] 2019/11/11(月) 19:47:40.14


メンテナンスは事前に予告してほしいよな
名無しさん@お腹いっぱい。 [sage] 2019/11/12(火) 00:42:02.53
アドレスの文字列にNGワードがあってublockが反応してるケースがあった
archive全体もスルーにしないとあかんかな
名無しさん@お腹いっぱい。 [sage] 2019/11/12(火) 23:49:49.89
なるほどなあ
名無しさん@お腹いっぱい。 [] 2019/11/14(木) 06:06:11.27
Internet Archive

We're experiencing some technical issues, cause
undetermined at the moment. Site availability may be
spotty for a while. We will update when we have more
news. Thanks for your patience!

5:49 - 2019年11月14日

ttp://https://twitter.com/internetarchive/status/1194719014045380608
ttp://https://twitter.com/5chan_nel (5ch newer account)
名無しさん@お腹いっぱい。 [] 2019/11/14(木) 06:10:32.45
Internet Archive

Update: We should be stable again, looks like it was a
router issue.

6:06 - 2019年11月14日

ttp://https://twitter.com/internetarchive/status/1194723218638036992
ttp://https://twitter.com/5chan_nel (5ch newer account)
名無しさん@お腹いっぱい。 [] 2019/11/14(木) 14:43:21.45

ttps://i.imgur.com/nINvdBL.jpg
名無しさん@お腹いっぱい。 [sage] 2019/11/14(木) 18:02:27.39
正直日本ではこれ以上有名になって欲しくない
アーカイブの重要性が広まってない状態で有名になっても
アーカイブの削除や拒否だらけになる未来しかみえん
名無しさん@お腹いっぱい。 [sage] 2019/11/19(火) 14:17:20.49
北斎美術館は何やらアクセス弾いてるねえ
名無しさん@お腹いっぱい。 [] 2019/11/19(火) 14:18:01.39

国会図書館のアーカイブがもっと貪欲で解放的ならいいんだけど
名無しさん@お腹いっぱい。 [sage] 2019/11/19(火) 17:11:57.36
公正利用の概念を広めて開放させるしかない
名無しさん@お腹いっぱい。 [sage] 2019/11/19(火) 20:27:30.18
某所で炎上したとあるサイトの管理人がInternet Archiveに英語メール送って、証拠用にSavePageNowで取られたアーカイブを非表示にさせた事例は前に見たことがある
Archive.todayにもアーカイブ取ってる人がいたから証拠が消え失せることはなかったけど、Wayback Machineのアーカイブって結構危ういよね
名無しさん@お腹いっぱい。 [sage] 2019/11/19(火) 20:37:29.65
ちなみにそのサイトは炎上騒ぎの後ia_archiverを弾くようにrobots.txtを変更してたけど、
SPNではブラウザのUserAgentが用いられるのでSPNでアーカイブを取ること自体は今でも可能なまま
ただし取得しても"This URL has been excluded from the Wayback Machine."という例の表示が出て閲覧はできない
"
名無しさん@お腹いっぱい。 [sage] 2019/11/20(水) 19:56:41.89
Boomerを更新してもBoomerが出るようになった。
名無しさん@お腹いっぱい。 [sage] 2019/11/20(水) 22:06:09.19
ぶまりまくり
名無しさん@お腹いっぱい。 [sage] 2019/11/21(木) 18:41:47.05
outlinkが一覧の他のページも保存しちゃうから次のページのoutlink取得しようとしても10分以上待たなくてはならない。
取得直後のページは10分間保存なしにして、他のページだけ保存してくれればいいのに。
名無しさん@お腹いっぱい。 [] 2019/11/21(木) 20:46:01.10


> outlinkが一覧の他のページも保存しちゃうから次のページのoutlink取得しようとしても10分以上待たなくてはならない。


あー、そうなのか。それは知らなかった。
名無しさん@お腹いっぱい。 [sage] 2019/11/22(金) 05:05:33.68
MapionとかGoogle Mapも取れるようになってほしい。
画像の撮影場所を示すのに使われているんだよね。
名無しさん@お腹いっぱい。 [sage] 2019/11/23(土) 14:33:03.22
先週辺りからまたおかしくなってるな。
新しく取得したものが、過去の一覧にすぐ反映されないとか。
または取得できたと思ったら、確認すたらまだ取得前の画面に戻っちゃったりとか。
名無しさん@お腹いっぱい。 [sage] 2019/11/23(土) 18:47:42.65
またこいつか
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 04:12:55.82
503が返ってくるようになったので、アク禁されたのかと思ったが、
TOP開いたらScheduled Maintenanceだった。永久アク禁されてなければいいけど。
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 14:07:26.69
もう今日はお話にならねえくらい酷い状態だな

Sorry連発
かつ魚拓の結果が全然出て来ねえ
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 17:09:39.82
ヒゲソーリー
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 18:20:09.27
最近調子いいなぁと思ったら急に悪くなったりツンデレなのか?


今日はAPIにすら反映されてないから止めたほうが良さげ
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 21:51:57.94
あかんメンテ後ずっとこれや

This page is not available on the web

because of server error
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 22:40:57.15
使い物にならんな
深夜に取った分ちゃんと取れてるかも怪しい
名無しさん@お腹いっぱい。 [sage] 2019/11/24(日) 22:59:40.58
物理的にどっかで断線でもしてるんじゃないかと疑うレベル
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 01:04:25.15
Wi-Fiの近くで電子レンジ使ってるのかもしれない
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 08:18:55.82
毎日取得されているurlのアーカイブ一覧でも23日の10:00(UTC)くらいからバタッと取得止まってるのな
週末に入ってるから復旧遅れてそう
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 10:15:46.16
ここ使えなくなったらすごく困る
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 10:44:48.59
とりあえず新規の取得は直ったっぽい?
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 10:57:07.90
いけるな
名無しさん@お腹いっぱい。 [sage] 2019/11/25(月) 13:34:09.71
入れ替わりにウェブ魚拓がおかしくなってる
名無しさん@お腹いっぱい。 [sage] 2019/11/26(火) 22:33:36.61
復旧そして寄付募集モードか
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 09:30:14.40
こんだけ不安定だと寄付のお願いの必死さに説得力がある
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 13:29:45.43
ここ数日保存したのを確認したらほぼ全滅
これじゃとても寄付はできんな
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 13:38:00.12
寄付しないと余計に酷くなるだろうし、財布に余裕が出来たら少し寄付しようかと思う
インターネットアーカイブが完全に使えなくなったら本当に困るし
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 20:11:21.49
Twitter社が半年以上ツイートしてないアカウントを12月に削除するらしい
故人のアカウントも消えてしまうのかと問題になってるんだけど消えたら困る
とりあえず急いで特に大事なツイートはここに保存してるけど
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 21:41:08.20
なにそれひどい
名無しさん@お腹いっぱい。 [sage] 2019/11/27(水) 23:33:06.17
みんなが捨て垢やらサブ垢やら作りまくってるからサーバを圧迫してるんだろな
UserStreamを廃止したのも資金の問題があったみたいだし事情は分かるが、
にしてもログイン確認できなければ一括削除ってのは残酷すぎる気はするな
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 01:48:23.89
半年ってなあ
逆にbot投稿ならこれに引っかからずに生き残るんだろうし
バランス悪い結末になりそうだ
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 11:40:49.76
混乱と反対が大きかったためか、故人のアカウントをどうするか上手い方法が見つかるまで削除は当面延期するそうな
とりあえず余裕は出来たけど、Twitterのアーカイブという懸案事項もできたな
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 15:06:24.40
archive.is 鯖臨終か(´・ω・`)?

#192q…とか出る 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 15:16:46.64
archive.is試しに保存したが普通だぞ
IAの方が23日以降に保存した内容が時間とともに消えてヤバイ
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 16:00:47.27
ttps://news.livedoor.com/lite/article_detail/17447598/
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 16:48:06.51

確かに保存はできるが、いかんせん待ち時間がクソ長過ぎる。

案の定、デイ○ースポーツの芸能カテゴリー取ったら、
待ち時間のあいだに記事が一つ追加されて、先にIAで取ったやつと比べて
「ズレ」が生じちゃったじゃないか…。魚拓を取るなら、全て同じ条件で取りたいのに。
名無しさん@お腹いっぱい。 [age] 2019/11/28(木) 16:52:32.45
またこいつか
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 17:09:30.25
でも俺はやりたいんだよ。でもやるんだよ!文句あるか?

ただ、あそこはメンテナンスでもやったのか?
しぱらくデ○リースポーツの記事が、テキスト状態でしか取れなかったが、
今日取れたものは、以前と同じようにカラー・写真入りで取れてる。
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 18:22:24.06
そこまでデイリースポーツの完全なるアーカイブに固執する理由が気になる
傍から見てると、こういう言い方も良くないが正直異常に見えてしまう
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 18:39:07.23
それも固執している対象が個別の記事とかではなくて、
トップページとかカテゴリー別とかの一覧ページだからなwww
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 19:36:04.74
デイリースポーツのマニア = 熱狂的な阪神ファン
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 19:54:18.49
あたりが初出かな。
キーボードをバンバン叩いてアーカイブを取得する行為そのもので
アドレナリンがピュピュッと出ちゃう人なんだろうな。
本当に必要性を感じているなら、自動化とかもう少し別の方向を
考えてるだろ。二年間もの間、何やってたんだ。
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 21:51:58.70
「自動化は信用ならない、自分の手でしっかりとアーカイブできたか確認したい」ということな分からないではないが、それにしても時間の無駄では?
名無しさん@お腹いっぱい。 [sage] 2019/11/28(木) 23:01:43.61
実際画像メインのサイトなのに画像が全く取れておらず
アーカイブ検索時の邪魔になってるだけのアホアーカイブもチラホラ見かけるんで
確実にってのはわからなくはない
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 23:27:32.18
何?コレ
ttps://f.uploader.xzy.pw/eu-prd/upload/20191128232625_34756b6f49.png
名無しさん@お腹いっぱい。 [] 2019/11/28(木) 23:56:56.97

何年か前の閉鎖された海外ロダ群でコレよく見かけたな
先に読みづらい認証コードいれろってヤツ
214 [sage] 2019/11/29(金) 12:25:26.34
Archive.is の待ち時間がクソ長過ぎるという話。

同サイトで定期的にアーカイブを取得させるスクリプトを走らせていますが、
1. 事前に ttp://http://Archive.is/ からトークンを取得。
2. ターゲット URL 等の情報を ttp://http://Archive.is/submit/ へ送信 (POST)。
3. 200 応答が返り、コンテントボディに loading.gif への参照が
含まれていればアーカイブ成功と判断し終了、あとは知らんぷり。
― 以上の手順で問題は起きていないですね。

取得開始からアーカイブ完了まで時間が掛かるのはあちら側のプロセスなので
仕方が無いとして、取得状況を羅列したページを繰り返し読ませるのは
人間向けのただの演出。


記事のリストはベースの HTML に含まれていて、アーカイブ時は一番最初に
保存されるファイルですから、待ち時間云々は無関係。
単にアーカイブを開始させるまでに時間が掛かってしまっただけ。


CloudFlare でホストされているサイトに Tor 経由でアクセスすると良く出ていましたね。
数ヶ月前にそれが突然出なくなってしまい、逆にこちらが「まさか生で繋がってる?」と
不安になったことがあります。
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 13:07:14.17
214氏には各アーカイブサイトの自動化の知見についてブログかQiitaかどこかにぜひまとめて文章化して欲しい
需要はかなりあると思うんだが
名無しさん@お腹いっぱい。 [] 2019/11/29(金) 14:16:06.48
archive.is、内部リンクの置換が廃止された?
28日以降のアーカイブは元リンクに飛ぶ
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 16:38:28.77
23日以降から全部アーカイブ消えてるんだけど・・・・
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 18:41:10.81
なんかアーカイブしたはずなのに検索にURL入れてもアーカイブされて無いって出るんだけど…
それでもう一度アーカイブすると初めてアーカイブした扱いになってて、検索でURL入れるとまた無いってなるんだけど…なにこれ
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 21:43:52.53
もう一度やってみたらどうもアーカイブは一応とれてるみたいだけど
検索でURL入れても最近のアーカイブは結果に出てこなくなってるっぽい
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 22:26:47.01
昨日試しにこのスレ保存してブクマしといたが半日ほどで消えた
今はまともに保存できないらしい
名無しさん@お腹いっぱい。 [sage] 2019/11/29(金) 22:59:48.91
保存関連の処理とアーカイブのインデクシング・閲覧関連の処理は別々のプログラムが担ってるからな
今回は後者の部分が不安定になってるんだと思う
名無しさん@お腹いっぱい。 [sage] 2019/11/30(土) 16:34:33.79
これじゃ使い物にならんな
困ったもんだ
名無しさん@お腹いっぱい。 [sage] 2019/11/30(土) 21:34:11.13
お金が無いから寄付できない
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 03:28:20.27
正常に戻ったらしい
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 12:38:23.38
おれはしんじないぞ
214 [sage] 2019/12/01(日) 15:11:22.39

ファイルが Internet Archive に保存できているかどうかを確認するために
先頭に ttp://http://web.archive.org/web/2/〜 を付けた URL でチェックするのですが、
/2/ を保存日時の数字に置き換えた URL へリダイレクトできているのに、
つまり当該日時のアーカイブが存在することが判っているのに、
そのリダイレクト先では Save Page Now (404 Not Found)。
ここ二週間ほど、こんなことが度々起きています。
つくづく「別プロセスなんだなぁ」と感じます。
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 16:13:17.83
今回の件は寄付集めるための小細工にも思えたがな
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 16:52:50.58
そんな小細工なんてやられたら
瞬時で変わるやつが取れないじゃないか

こんな誤爆も取れやしない
ttps://i.imgur.com/L12ywG3.jpg
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 17:04:17.49
またこいつか
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 17:08:17.88
また手抜きか
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 17:44:15.43
普通にワンクリックで取っていても「リダイレクトが繰り返し行われました」
「Cookie を消去してみてください」という表示が時々出るな.
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 18:34:06.36
仕組みが良くわからん
こっちのクッキー使うのか
名無しさん@お腹いっぱい。 [sage] 2019/12/01(日) 21:43:13.83
IAは「クッキーを食べないブラウザ」として動作するから
クッキーを食わせるために無限リダイレクトループ、
それがそっくりそのままアーカイブされてしまったんじゃないの?
名無しさん@お腹いっぱい。 [sage] 2019/12/02(月) 14:33:54.58
一時的にIAを弾いてたとしても内部的には情報は保存されてるのか
消えたと思ってたが安心した
名無しさん@お腹いっぱい。 [] 2019/12/02(月) 15:20:57.07
archive.is

robots.txtに従わない 👀
Rock54: Caution(BBR-MD5:1322b9cf791dd10729e510ca36a73322)
名無しさん@お腹いっぱい。 [sage] 2019/12/02(月) 15:59:43.26
なにそのおめめ
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 00:53:30.05
donateに&#128151;が付いてて笑った
というか60ペタバイト超えてたのね
ttp://https://archive.org/donate/
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 00:55:14.67

あ、文字化けしちゃった
それハート
名無しさん@お腹いっぱい。 [] 2019/12/03(火) 01:43:21.99
donate
ttps://i.imgur.com/g3xBqiq.jpg
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 03:42:51.04
Donateリンクにハートマークって他のサイトでも結構見るよ
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 08:47:03.97
確かに英語圏のサイトだと結構よく見るよね
何かそういう文化か風習か何かがあるんだろうと思う
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 12:11:20.12
日本人が感じる猫なで声ニュアンスはないってことだろうか
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 13:57:02.07
60PBかぁ…
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 14:31:13.73
案外そんなもんなのな
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 15:32:38.45
多いと見るべきか少ないと見るべきか
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 16:06:30.58
再巡回時に同じデータだった場合「同じでした」とだけ記録してるのかな
それとも完全重複で保存してるのかな
名無しさん@お腹いっぱい。 [] 2019/12/03(火) 19:38:11.00
スポーツ紙をアーカイブすると「記事を見る」の部分が折り畳まれる(´・ω・`) 開けない(´・ω・`)
名無しさん@お腹いっぱい。 [sage] 2019/12/03(火) 22:19:17.87
またこいつか
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 00:48:12.20
どれだよ
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 13:27:45.32

自前でアーカイブ取るか?
鯖からのソース保存じゃなく、その瞬間ブラウザで表示してる状態で保存する自作のブックマークレットある

ブラウザでブックマークすれば保存できる
冒頭のjavascript:はブラウザによってはペーストしたときに自動で剥がれるので、剥がれてたら自分で付け直してブックマークすること
javascript:(()=>{'use strict';const c=new Date(),h=document.documentElement.cloneNode(true);
let n=h.querySelectorAll('[href]'),i=n.length-1;while(i>=0){n[i].href=new URL(n[i].href,location.href).href;i--;}n=h.querySelectorAll('[src]');i=n.length-1;while(i>=0){n[i].src=new URL(n[i].src,location.href).href;i--;}
const b=new Blob([new XMLSerializer().serializeToString(document.doctype)+h.outerHTML],{type:'text/html'});const a=document.createElement('a');
a.download=c.toUTCString()+
' - '+decodeURI(location.href).replace(/\*/g,'*').replace(/\//g,'/').replace(/:/g,':').replace(/:/g,':').replace(/\\/g,'\').replace(/\|/g,'│').substring(0,123)
+'.html';a.href=(URL||webkitURL).createObjectURL(b);a.click();})();
名無しさん@お腹いっぱい。 [] 2019/12/04(水) 13:41:01.27

レスの一行制限で改行入れたけど、多分「"+"の前の改行」で動かんと思うから
改行消してやってくれ
改行全部取っても動くようにしてあるからそれでも良いが
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 18:15:27.35
最近のarchiveisはもう駄目だな
待ち時間長くなったうえに今日は巻き戻るから取得すらまともに行われない
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 20:12:20.89
昨日は魚拓経由でつかえたけど今日は何やってもだめだ
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 20:29:10.85
どうせまたシュポーツのはなしなんでしょう
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 22:21:53.92
いえいえシュポーチュでちゅよ
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 23:06:06.88
Archive.isやら何やらの話してる人はウェブ魚拓スレに行ってや
IAの話の中で他サービスの話題が出るのは分かるがこの場合はそうじゃないだろ
名無しさん@お腹いっぱい。 [sage] 2019/12/04(水) 23:25:27.70
pixivって今アーカイブできない?
昔はできてた気がするけど
名無しさん@お腹いっぱい。 [sage] 2019/12/05(木) 01:05:02.52

いくつかSPNに突っ込んで試してきた
保存完了の表示は出るけどWayback自体が不安定なせいか、アーカイブが表示できたり出来なかったりするんだよな
スクリーンショットの方はとりあえず取れてたから、おそらく普通のアーカイブの方も取れてるんじゃないかと思う
まとめると、おそらくアーカイブIA側が不安定だから
名無しさん@お腹いっぱい。 [sage] 2019/12/05(木) 01:07:00.25
途中送信してしまった
まとめると、おそらくアーカイブは出来るがIA側が不安定なせいで上手く行ってないだけだと思われる
あとアーカイブ時に日本国外の回線からアクセスするので、英語版ページへリダイレクトされる点にも注意
名無しさん@お腹いっぱい。 [sage] 2019/12/05(木) 01:37:24.50

なるほどサンクス
214 [sage] 2019/12/05(木) 22:39:02.46
ここでは、動画の内容に関する話は抜きで。
ttp://web.archive.org/web/20190717122047id_/video.twimg.com/ext_tw_video/1146432912117489664/pu/vid/1280x720/DhxeMNq_qWw8iakm.mp4
普通にアクセスを掛けても、どういう訳か 200 OK ではなく 206 Partial Content を返してくる。
当然、返してはいけない応答なので一般的なクライアントではダウンロードできない。

レスポンスヘッダを見ると
X-Archive-Orig-Content-Range: bytes 0-3091160/3091161
という行があるので、あるクライアントが Internet Archive に当該ファイルを
保存するよう要求したときに
Range: bytes=0-3091160
の指定が何故か付いてしまっていて、それがそのまま IA から video.twimg.com に送られ、
範囲指定付きリクエストとして処理された応答が IA にアーカイブされた、
ということだと思う。
しかし、何をどうやったら範囲指定付きのアーカイブ要求なんか出るのかねぇ。
名無しさん@お腹いっぱい。 [] 2019/12/06(金) 01:10:23.89

グロ
名無しさん@お腹いっぱい。 [sage] 2019/12/06(金) 16:10:30.65
検証用環境がなくて断定出来ないので完全な予想だが、Heritrixか何かの設定のせいなのかもな
Save Page Now経由で取得できる動画の容量にあらかじめ制限をかけてあるんじゃないだろうか
動画はかなり通信量を食うし、無制限の取得を許可したら色々な面で大変な事になるだろうから、
そういうリミッターが存在しても不思議ではないと思う
名無しさん@お腹いっぱい。 [sage] 2019/12/10(火) 03:14:02.77
うーんpixiv保存するとなぜかどうしても保存されるのが真っ白なページになってしまう
なぜだろう
名無しさん@お腹いっぱい。 [sage] 2019/12/13(金) 20:50:45.96
やたらと寄付呼び掛けてるの何だろうと思ったら
データ量が急激に増えててヤバイらしいな
ttp://https://gigazine.net/news/20191212-thread-internet-archives-silent-killer/
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 00:52:12.88

これはヤバいな
2019年だけで10ペタバイト、1996年〜2011年に保存した量の2倍ものデータが追加されたとか…
いくら寄付を集めたところでこんな膨大な量がずっと増え続けていくんじゃじり貧になるのは目に見えてる気が…
お金だけじゃなくて置き場所も足りなくなりそう
AI使って同じだったりほとんど変化の無いページは消していくとかしないと
あとは結局クロールする範囲を元と同じに減らすしかなくなる気がする
それとクラウド使ってないってことはここのサーバーが火事とかになったら全部パーってことでそれも怖いな
Googleみたいに世界中に何十にもバックアップとか入念な事はしてなさそうだし
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 01:24:28.94
save now機能付けたころこのスレでも大丈夫なんかとは言われてたよね
名無しさん@お腹いっぱい。 [] 2019/12/14(土) 02:32:43.65
10PB(10000TB)多杉ワロタ
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 06:18:10.30
どっかの富豪がポンと出してくれねえかな
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 09:20:55.55
不安定なのに寄付なんかできないとか言ってる人をどこかで見かけたがアホかと思う
寄付しないといけない状況だからこそ不安定なんだろ
806 [sage] 2019/12/14(土) 09:32:00.38
逆だな
不安定だからこそ寄付しないといけない
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 13:01:50.15
追加データに際限はなく増大の一途
後20年持つサービスではないな
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 14:14:54.67
まー言い換えれば最悪の場合その1996-2011のだけ残せばコスパ高そうだな
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 22:59:39.72
客観的に勧化得た場合
もしも残す価値や必要性があると思ったらお金持ちは寄付するだろうね

荒らしみたいなことを言ってすみません
名無しさん@お腹いっぱい。 [sage] 2019/12/14(土) 23:42:51.87
ちっとも荒らしみたいではないし、ちっとも客観的でもない
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 00:25:51.05
確かに荒らしっぽくないし同時に客観的でもない
慈善事業にしてもそんな地味なことに金使う富豪はいないだろ
苦しんでる人を援助することに優先して金を使うと考えるのが妥当
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 00:39:01.46
ツイッターで100万くれる人たちに運営がいいねするのはどうだろうか
名無しさん@お腹いっぱい。 [] 2019/12/15(日) 05:26:37.27
試しにvプリカ買ってきて寄付しようとしてみたけど寄付の受付部門にメールして問い合わせろって文章が表示されて弾かれっぱなし

海外の住所の書き方の通りにフォームは埋めたし、カードの番号も期限もセキュリティコードも全部確認したけど受け付けてもらえない

普通のクレジットカードからの寄付しか受け付けないってんなら、日本語版の案内を用意してない不親切さも頭に来るし寄付は無しだな
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 09:24:11.52
関係ないけどarchive.isの方でYouTubeのコメントが保存できるようになってるな
昔もできてたけどここ何年かはできなくなってたから嬉しい
Internet ArchiveだとYouTubeは保存できないから
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 10:20:06.78
Vプリカは向こうからは完全にVISAクレカと同じにしか見えないはず
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 10:24:48.92
いやVプリカが使えるとかどこにも書いてないだろ
PayPalアカウント持ってるならあらかじめ入金しておいた上で支払う事は出来ると思うが
むしろクレジットカードと同じようにしてVプリカを使えると思ってる方が間違ってるぞ
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 10:32:20.60
個人的な経験で理由は分からないけど、国外との支払いでVプリカ使うと上手くいかない場合がそれなりにある
PayPal併用した方が確実
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 11:13:52.79
>日本語版の案内を用意してない不親切さも頭に来る
随分身勝手な奴だな、Wikipediaじゃあるまいしそこまでするリソースも余裕もある訳無いだろうが
寄付関連の案内が全く存在しなかったら不親切と言えるだろうがそういう訳でもないし、
Google翻訳使えば読めるものを不親切だとか言うのはおかしい
5chは使える癖にGoogle翻訳を使う脳味噌は無いのな、哀れ
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 13:05:17.56
親衛隊が裾野の広がりを阻害するよくある構図を見た
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 14:35:08.84
信者とは大体そういうもの
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 18:36:34.75
寄付のお願いだけで済ませてくる分宗教としてはだいぶ良心的
本物の宗教と違って無くなったら困るけど
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 19:09:23.94
Internet Archive以外でネット情報の保存活動に積極的なところが全然無いのは
著作権とかの問題もあるがそれよりも結局はこうやって天文学的な量の情報が日々無限に増え続けていって困るのが予想できるからなんだろうな
それだけにあえて頑張っているここは貴重で応援したいが
本当にどうするんだろうな
もはや現代ではほとんどの情報がネット依存状態なのに
もしここが無くなったら人類の歴史で現代の情報だけがすっぽり消えてしまって空白地帯になって大損失だろう
名無しさん@お腹いっぱい。 [sage] 2019/12/15(日) 19:43:27.59
AWSとかGoogleとかがやってくんねーかなー
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 01:26:51.36
Googleはやろうと思えば出来るだろうけど
まぁ結局金にならないっていう問題にぶち当たるんだよねぇ・・・
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 04:03:11.78

そもそも金になった時点で問題。
フェアユースの範疇から外れて、アーカイブ自体が違法コピーに成り下がる。
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 13:09:42.33
非営利団体だからこそWayback Machineなんてグレーな代物を運用できるわけで
Googleが寄付するって形にすれば法的にはセーフかもしれないが、Googleの金がInternet Archiveにまで入ったら法律とは別の問題でマズいことになりそう
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 13:53:45.28
伊達直人待ちw
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 16:37:02.92
翌朝、Internet Archiveのサーバーの前にピカピカのランドセルが
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 19:47:03.01
せめてHDD贈ってやれよ
名無しさん@お腹いっぱい。 [sage] 2019/12/17(火) 22:05:43.63
ランドセルは安いモデルでも実用上大差ないけど安価なHDDはSMRだし…
名無しさん@お腹いっぱい。 [sage] 2019/12/18(水) 01:57:01.95
outlinksがSavingのまま止まる
調子悪いのか
名無しさん@お腹いっぱい。 [sage] 2019/12/18(水) 16:51:08.99
寄付のお願いが出始める前後からずっとoutlinksは不安定
名無しさん@お腹いっぱい。 [sage] 2019/12/19(木) 15:57:12.43
英国立図書館のWebCiteはどう?

IA以上に貧化してるか…
名無しさん@お腹いっぱい。 [] 2019/12/19(木) 19:01:15.90
WebCite は新しい魚拓は取れないのではなかったかな?
名無しさん@お腹いっぱい。 [sage] 2019/12/19(木) 21:15:03.17

そうだったのかThx
名無しさん@お腹いっぱい。 [sage] 2019/12/19(木) 23:45:04.57
安全な接続ができませんでしたって出る
名無しさん@お腹いっぱい。 [sage] 2019/12/20(金) 09:54:11.83
ここってアメリカ政府とかも利用してなかったっけ?いざとなったらお偉いさんが金出して保護するんじゃないかな
名無しさん@お腹いっぱい。 [sage] 2019/12/20(金) 19:46:31.57
そこまで楽観的でもない
非営利の図書館やアーカイブ団体はどこも大体同じように財政難に直面してる
世界最大規模の図書館として有名なニューヨーク公共図書館でさえ、資金繰りに四苦八苦して寄付を求めて駆けずり回ってる訳で
名無しさん@お腹いっぱい。 [sage] 2019/12/23(月) 16:11:26.79
Job failed
名無しさん@お腹いっぱい。 [sage] 2019/12/24(火) 11:02:46.59
寄付600万ドルがゴールになってるけど、そんだけでやってけるもんなのかね?
とりあえず5ドル投げたけど
名無しさん@お腹いっぱい。 [sage] 2019/12/24(火) 20:13:46.86
いずれ枯渇はするけど当面はそれだけあればやって行けそう、ってことだと思う
名無しさん@お腹いっぱい。 [sage] 2019/12/27(金) 22:10:02.02
最近Twitterのどんなちょっとした下らないいいねもリツイートもないような呟きでも全て即座に網羅的にここに保存されてる事に気づいた
そりゃパンクするわ
◆P0jSlC5fJs [sage] 2019/12/28(土) 09:51:39.93
ほんとだ
のためかな?
名無しさん@お腹いっぱい。 [sage] 2019/12/28(土) 10:35:54.56
調べたところの発表を受けてArchiveTeamが動いてるみたいだな
ttp://https://archive.org/details/archiveteam_twitter
一応「故人のアカウントを保存する方法が見つかるまで削除延期」とTwitter側は言ってるけど、ArchiveTeamはそれで満足するような組織じゃないし
名無しさん@お腹いっぱい。 [sage] 2019/12/28(土) 10:54:17.93
裏を返せば「保全する方法が見つかったら削除開始するよ」って意味でもある訳だからそりゃアーカイブするわ
名無しさん@お腹いっぱい。 [sage] 2019/12/28(土) 12:14:58.98
Twitterと連携して全公開TweetデータをIAに渡してくれれば一番楽?
名無しさん@お腹いっぱい。 [sage] 2019/12/28(土) 15:51:27.64
そのまえにGoogleでのリアルタイム検索を再開してくれよ
名無しさん@お腹いっぱい。 [sage] 2019/12/28(土) 18:46:36.33
とりあえずアーカイブされたがurlがわからず
二度と発掘されないただの化石と化してるデータも多いだろう
名無しさん@お腹いっぱい。 [sage] 2019/12/29(日) 12:37:56.09
今のアーカイブ量で全文検索したら凄まじい事になりそう
名無しさん@お腹いっぱい。 [sage] 2019/12/29(日) 20:38:31.40
全文じゃなくてドメイン+<title>+日付範囲でも相当役に立つんだけどな…
名無しさん@お腹いっぱい。 [sage] 2019/12/29(日) 22:24:56.57
検索エンジンの運用みたいに、先に索引付けしておくんじゃないの?知らんけど
名無しさん@お腹いっぱい。 [sage] 2020/01/01(水) 18:24:14.87
誰も本当のことなんて知らんのよ
名無しさん@お腹いっぱい。 [sage] 2020/01/01(水) 21:53:26.32
今年は何PB増えるのだろうか
名無しさん@お腹いっぱい。 [sage] 2020/01/04(土) 17:34:41.70
また落ちてるみたいね
全然取得できない
名無しさん@お腹いっぱい。 [sage] 2020/01/04(土) 18:48:46.85
メンテ画面になったね
果たして今回は何時間かかるのやら
名無しさん@お腹いっぱい。 [] 2020/01/04(土) 20:37:04.38
We're sorry ? something's gone wrong.

Our team has been notified.
名無しさん@お腹いっぱい。 [] 2020/01/04(土) 20:50:33.63
”donate done”が邪魔
名無しさん@お腹いっぱい。 [sage] 2020/01/05(日) 00:37:15.55
復活したのか
名無しさん@お腹いっぱい。 [sage] 2020/01/06(月) 13:21:37.31
punycode表記のURLの挙動がおかしくなるの
何とかならないのかね
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 00:05:36.73
600万ドルは確保出来たのかね

あとpaypalを通じて寄付をするって日本では違法だし、良くて規約違反でアカ消滅か悪くて警察沙汰にならね?
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 00:38:36.73

違法の根拠は?
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 01:56:13.79

ttp://https://donate.wikimedia.org/wiki/Problems_donating/ja#%E3%81%AA%E3%81%9C%E7%A7%81%E3%81%AE%E3%83%9A%E3%82%
A4%E3%83%91%E3%83%AB%E3%81%A7%E3%81%AE%E5%AF%84%E4%BB%98%E3%81%8C%E6%8B%92%E5%90%A6%E3%81%95%E3%82%8C%E3%81%9F%E3%81%AE%E3%81%A7%E3%81%99%E3%81%8B%EF%BC%9F
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 12:56:41.99

これ情報古くないか?
今は普通に受け付けてるぞ
名無しさん@お腹いっぱい。 [] 2020/01/07(火) 16:15:54.94
ttp://2chan.tv/jlab-long/s/long200107161313.jpg
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 22:50:28.41

スポーツ報知のアーカイブ頻度すごいな
いつぞやの人がついに自動化でも始めたのか
名無しさん@お腹いっぱい。 [sage] 2020/01/07(火) 23:43:03.07
個人の自由とはいえ何が彼を熱心にさせているのか
名無しさん@お腹いっぱい。 [sage] 2020/01/08(水) 10:17:03.71
まぁアーカイブという面では
そういう無償で熱心にやってくれる人が多い方がいいので
なんでそれに拘ってるのかは知らんが
名無しさん@お腹いっぱい。 [sage] 2020/01/08(水) 10:42:18.77
その辺が、ただマウスをポチポチするだけの人と
そうで無い人との違いなのかと。

PCを使った単純繰り返しの定型作業、自動化させてみたら
それが原因で首切られたなんて話もあるくらいだからねぇ。
名無しさん@お腹いっぱい。 [sage] 2020/01/08(水) 13:11:21.35
それにしても同一IPからこんな立て続けにリクエスト送れないはずだよな、自動で弾かれそうなもんだが
名無しさん@お腹いっぱい。 [] 2020/01/08(水) 16:25:36.62
報知だけバグ?

報知
ttp://2chan.tv/jlab-long/s/long200108162357.jpg

日刊スポーツ
ttp://2chan.tv/jlab-long/s/long200108162444.jpg
名無しさん@お腹いっぱい。 [sage] 2020/01/08(水) 23:20:07.30
F5連打で無駄に負荷かけまくってる悪質荒らしに近いな
名無しさん@お腹いっぱい。 [sage] 2020/01/10(金) 01:46:22.74
Base64エンコードで画像埋め込んでるサイトが文字化けするっぽい?
ttp://https://web.archive.org/web/20200109161142/http://up-img.net/img.php?mode=gif&id=2358
名無しさん@お腹いっぱい。 [] 2020/01/13(月) 07:11:00.39
応答が不安定になってる
名無しさん@お腹いっぱい。 [sage] 2020/01/13(月) 15:48:21.42
firstじゃないurlのは直近アーカイブからx週経過しないとNGの制限設ければいいのにな
未経過だと有料で取得できるようにすりゃタダで爆取得しやがる乞食のとばっちりもマシになる
名無しさん@お腹いっぱい。 [sage] 2020/01/13(月) 17:07:37.94

5chの過去ログに貼られてる閉鎖済みサイトをURL検索で発掘したり…



手動だが、Wikipediaの編集記事とかYahooニュースとかTLS1.2未満のブラウザや端末から直接読めなくなったページを読むために保存している。

魚拓やisにも取ってるがアーカイヴサービスまでTLS1.2必須に仕様変えられないことを祈る。
名無しさん@お腹いっぱい。 [] 2020/01/13(月) 19:49:00.13
Yahoo!ニュースをwaybackするとトップページがアーカイブされる
名無しさん@お腹いっぱい。 [] 2020/01/13(月) 21:13:26.42
ttp://2chan.tv/jlab-long/s/long200113211232.jpg
robots.txt noarchive
名無しさん@お腹いっぱい。 [sage] 2020/01/13(月) 23:25:29.31
Yahooニュースはいったん他所で取ったアーカイブを重ね取りすれば流れないンだったか。
名無しさん@お腹いっぱい。 [sage] 2020/01/14(火) 06:15:46.82
yjsecure.jsをNGすれば転送されない。散々既出
名無しさん@お腹いっぱい。 [] 2020/01/14(火) 20:36:57.97
adblockの詳細設定のマイフィルターリストに「*/yjsecure.js」を登録してadblock有効

と設定すればいいんだっけ?
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 09:16:22.85
ここ数日は取得しても古いアーカイブにリダイレクトされて本当に取得してあるか確認できないようになっているので注意
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 12:18:46.87
5ちゃんのURLアーカイブできなくなってない?数日前からできないんだけど
名無しさん@お腹いっぱい。 [save] 2020/01/15(水) 13:55:07.15
できる
ttps://web.archive.org/web/20200115045246/https://mevius.5ch.net/test/read.cgi/esite/1475246713/l50
名無しさん@お腹いっぱい。 [] 2020/01/15(水) 15:44:52.91
save page done. OK
ttp://2chan.tv/jlab-long/s/long200115153325.jpg
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 16:40:53.17
スマホ(笑
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 20:12:34.06
なんか自分の環境からはなぜか5ちゃんだけがアーカイブできなくなってしまった
回線変えたり接続し直したりvpnかましたり何度もリトライしてみたり色々やったら何とかできたスレもあるけどできないスレはどうやってもダメだ…謎
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 20:16:55.48
しょうがないからscのスレでアーカイブしてる
名無しさん@お腹いっぱい。 [sage] 2020/01/15(水) 21:39:39.04
ここ数日やっぱ調子悪いな〜古いアーカイブ確認出来ない
名無しさん@お腹いっぱい。 [sage] 2020/01/16(木) 21:48:45.85
また5ちゃん保存できるようになったわ
なんだったんだろう
名無しさん@お腹いっぱい。 [sage] 2020/01/17(金) 00:22:05.53
pcからの利用なのに時々sp用ページになるのが地味にストレス
名無しさん@お腹いっぱい。 [sage] 2020/01/17(金) 20:23:12.53
またアーカイブできない事がよく起きるようになった
5ちゃんだけじゃなくて他のサイトでもできなかったりたまにできたり…
不安定なのかな
名無しさん@お腹いっぱい。 [sage] 2020/01/17(金) 22:16:49.54
ここ3~4日はアーカイブまともに取得できなくて厳しいは
ウェブアーカイブじゃないと正しく取得出来ない所あるのに・・・
名無しさん@お腹いっぱい。 [] 2020/01/17(金) 22:36:17.99
SavePageNowのクッションページが頻繁に表示される
名無しさん@お腹いっぱい。 [sage] 2020/01/18(土) 16:57:15.18
ステータスコード200以外でリトライするスクリプト組んで放置してたら400capturesとかになって笑ってる
名無しさん@お腹いっぱい。 [sage] 2020/01/18(土) 19:15:17.66
クッションページ、画面は同じでURLに日付が入ってるやつと入ってないやつがあるっぽい。
214 [sage] 2020/01/19(日) 18:51:43.22
Internet Archive のファイルアップロード機能、あれを使うと
ユーザ登録に使っているメールアドレスが漏れるなぁ。

例としてこのファイルを挙げる。
ttp://https://archive.org/details/Pbtestfilemp4videotestmp4

右側の SHOW ALL のリンクからファイル一覧を開き、
ファイル名末尾が _meta.xml のファイルを見てみると、
<uploader> 要素の中にメールアドレスが記載されている。

元のページに戻り、Uploaded by で示されているアップロード者の
プロフページに入ってみる。
プロフのアバター画像は IA に直接アップロードすることもできるが、
この人はそれを行っていないため Gravatar の画像が参照されている。

Gravatar の画像 URL には、メールアドレスの MD5 ハッシュ値が含まれる。
先の XML から得たメールアドレスについて MD5 を取ってみると、双方の値が一致。
(大文字等を含むアドレスは一定の加工が必要だが、この例では無関係。)
つまり、XML から得たメールアドレスはユーザの登録アドレスで間違いない。

単に IA にユーザ登録を行ってプロフを持っているだけの状態からは
色々探してみたけど漏れっぽいものは見つからなかった。
ただアバター画像が初期状態のままだとメールアドレスのハッシュ値が
判るので、そこから他所で紐付けされてしまうことはあると思う。
名無しさん@お腹いっぱい。 [sage] 2020/01/19(日) 19:21:36.08

それは本人のアドレスで間違ってない、数年前からセキュリティ面で指摘されてる。
念のために言うと漏れてるんじゃなくて、アーカイブの証明の為に記載してると思うけどね。
「アーカイブ」である以上何らかの本人確認は必要なので。
214 [sage] 2020/01/20(月) 02:24:26.32

やはり既出だったか。
メタ情報として「誰がアップロードしたか」を記録しておく必要が
あるのは解るが、こういう形で出てしまうのは「漏れる」と表現したいなぁ。
システム上でユーザ名を名乗らせておきながら、どうしてメアドで記録してしまうのか。

ユーザ名は「一度使用した名前は二度と再利用させない」
(一度変えたら元に戻すことすらできない) なんてロックを掛けたりしているので
こちらの方が重要な識別子なのかと思ったけど、そういう訳では無いんだな。
名無しさん@お腹いっぱい。 [sage] 2020/01/24(金) 19:49:09.37
Browser crashedだらけ
名無しさん@お腹いっぱい。 [sage] 2020/01/24(金) 23:16:48.80

Browser crashed visiting URL

chrome使いだが、ここ数日でよく見るようになったな。
かといって何回も取ったら、後になって「何でこんな大量?」ってなりそうだから、
マーキング感覚で、1〜2回で留めるしかないのか。
名無しさん@お腹いっぱい。 [sage] 2020/01/25(土) 06:58:47.30
最近どのサイトも全然アーカイブできない…
名無しさん@お腹いっぱい。 [sage] 2020/01/25(土) 15:55:38.68
tamperだかgreaseだかでリトライし続けるようにすればいつかアーカイブされるし…
名無しさん@お腹いっぱい。 [sage] 2020/01/25(土) 17:15:48.05
アーカイブ出来てないように見えて後日チェックしてみるとアーカイブされてたってのはある
チェックしてみろ
名無しさん@お腹いっぱい。 [sage] 2020/01/25(土) 19:41:42.77
/save/で保存してapiで確認して取れてなかったらもっかい保存
名無しさん@お腹いっぱい。 [sage] 2020/01/26(日) 13:38:27.79
最近APIも反映が遅くてな・・・
まぁ一定周期で重くなるのはいつもの事だし、気長に待つけども
名無しさん@お腹いっぱい。 [sage] 2020/01/26(日) 21:12:27.93
save outlinksにチェックを入れて保存しようとすると↓みたいなエラーになるな。
ttp://2chan.tv/jlab-long/s/long200126211024.png
まぁ、今朝の9時から18時前位まで全く保存が効かなかったからそれよりはマシだけどさ…
◆P0jSlC5fJs [sage] 2020/01/27(月) 01:59:35.23
save outlinksなしでもJob failed
26日から
名無しさん@お腹いっぱい。 [sage] 2020/01/27(月) 02:32:40.79
今サイトにアクセスできなくなってる
名無しさん@お腹いっぱい。 [sage] 2020/01/27(月) 17:18:56.37
Job failed
ヨブがやらかした
214 [sage] 2020/01/30(木) 20:22:04.84
なんか玉葱経由で保管させると後でアーカイブが消されてるような気がするけど
気のせいかな。
名無しさん@お腹いっぱい。 [sage] 2020/01/31(金) 22:02:36.33
Twitterの仕様変更のせいかアーカイブ出来なくなってしまった
名無しさん@お腹いっぱい。 [] 2020/01/31(金) 23:29:38.35
save outlinksにチェック入れて保存するもリンク先が記録できず
今日でサービス終了するサイトなんで頼む…
名無しさん@お腹いっぱい。 [] 2020/01/31(金) 23:33:58.40
保存時にエラーっぽい表示はなかったし
saveしたページ自体はもう反映されてるが、そのリンク先だけ見れないのでタイムラグだとしても妙

かといってもう一回叩くのも負荷になるしやめたい
名無しさん@お腹いっぱい。 [] 2020/01/31(金) 23:43:47.08
試しにもう一回やったらsave outlinksにチェック入れてるのにそのページしか保存してないorz
名無しさん@お腹いっぱい。 [] 2020/01/31(金) 23:44:20.72
Save error pages抜きとsave outlinksチェックは両立しない??
名無しさん@お腹いっぱい。 [sage] 2020/02/01(土) 17:40:18.81
ツッイターどうすれば
名無しさん@お腹いっぱい。 [sage] 2020/02/01(土) 20:01:43.92

IAが苦手な形式になったから無理だと思う
download elementsを見ると画像とかは取れてるみたいだが・・・
名無しさん@お腹いっぱい。 [sage] 2020/02/01(土) 20:39:24.53
最近本気保存してたことへの意趣返しなの?
名無しさん@お腹いっぱい。 [sage] 2020/02/02(日) 11:38:13.93
TwitterはmegalodonやArchive.todayの方がまだ取りやすい気がしてきた


苦手な形式になったってどういうことなんや
詳しく教えてくれないか
名無しさん@お腹いっぱい。 [sage] 2020/02/02(日) 14:50:40.09
todayの方だと普通に取れるね>Twitter
謎だ
名無しさん@お腹いっぱい。 [sage] 2020/02/02(日) 18:22:01.39
IE11のUAだと古いのになるはずよね
名無しさん@お腹いっぱい。 [sage] 2020/02/03(月) 21:18:00.49
save outlinksが無くなってる…
ttp://2chan.tv/jlab-long/s/long200203211629.png
名無しさん@お腹いっぱい。 [sage] 2020/02/03(月) 21:33:12.46

サインインしろって書いてるよ
名無しさん@お腹いっぱい。 [sage] 2020/02/03(月) 21:49:45.12
アウトしてしまったか
名無しさん@お腹いっぱい。 [] 2020/02/05(水) 16:24:47.98
Wayback はサインイン(ログイン)しないと
スクリーンショットが取れない仕様に改変された。
ヤフーニュースの魚拓を取るときには注意しよう。
名無しさん@お腹いっぱい。 [sage] 2020/02/05(水) 18:55:39.60

前からじゃなかったか?
名無しさん@お腹いっぱい。 [] 2020/02/05(水) 19:43:07.89


半月ぐらい前はそうではなかった。
名無しさん@お腹いっぱい。 [sage] 2020/02/07(金) 11:17:42.22
Twitterが全然とれん…
214 [sage] 2020/02/07(金) 12:36:52.45
Firefox で general.useragent.override に
Mozilla/5.0 (Windows NT 6.3; WOW64; Trident/7.0; Touch; .NET4.0E; .NET4.0C; .NET CLR 3.5.30729; .NET CLR 2.0.50727; .NET CLR 3.0.30729; Tablet PC 2.0; rv:11.0) like Gecko
と入れてやってみたら、こんな感じ↓。
ttp://http://web.archive.org/web/20200207033245/twitter.com/TwitterJP/status/1224802584650584064
ttp://https://twitter.com/5chan_nel (5ch newer account)
214 [sage] 2020/02/07(金) 12:42:22.25
の User-Agent、たまたま拾ったのがこの文字列だっただけなので
Internet Explorer と判定されるような内容なら何でも良いと思う。
名無しさん@お腹いっぱい。 [sage] 2020/02/07(金) 14:01:40.00
おお
名無しさん@お腹いっぱい。 [sage] 2020/02/07(金) 14:02:43.87
最初からgeneral.useragent.override.web.archive.orgに入れっぱなしでもいいのかも
名無しさん@お腹いっぱい。 [sage] 2020/02/15(土) 11:51:31.56
なぜかInternet Explorer経由でないとTwitterのアーカイブが取れないのね
名無しさん@お腹いっぱい。 [sage] 2020/02/15(土) 18:14:13.15
別に何故かでもないんだけど今後IAはこういうのどうするのかな
名無しさん@お腹いっぱい。 [sage] 2020/02/15(土) 20:28:10.52
なんかTwitter何も対策せずに取れるようになってるな
要望が多かったんだろうか?
名無しさん@お腹いっぱい。 [sage] 2020/02/16(日) 15:56:32.12
504 Gateway Time-out
名無しさん@お腹いっぱい。 [sage] 2020/02/17(月) 20:37:04.68
もしかしてルートパスのリンク取れないのか
名無しさん@お腹いっぱい。 [sage] 2020/02/22(土) 09:16:04.83
ロイター通信の記事キャプチャがおかしくなる
本文が空白で読めない

米とタリバン、29日に和平合意調印 暴力削減期間の終了後に - ロイター
ttp://https://web.archive.org/web/20200221235532/jp.reuters.com/article/usa-afghanistan-talks-sign-idJPKBN20F2R6

コラム:円急落、「安全通貨」の機能終えんか=佐々木融氏 - ロイター
ttp://https://web.archive.org/web/20200221235903/jp.reuters.com/article/column-tohru-sasaki-idJPKBN20F10U

アマゾンはURLエンコードすれば通るんちゃう?
ttp://https://a%4Dazon.co.jp
名無しさん@お腹いっぱい。 [sage] 2020/02/22(土) 09:22:08.04
アマゾンは無関係
テストスレと間違えて追加してしまった失礼
名無しさん@お腹いっぱい。 [] 2020/02/22(土) 16:29:21.75


> 米とタリバン、29日に和平合意調印 暴力削減期間の終了後に - ロイター
> ttp://https://web.archive.org/web/20200221235532/jp.reuters.com/article/usa-afghanistan-talks-sign-idJPKBN20F2R6


今見たら問題ないみたいだけど?
名無しさん@お腹いっぱい。 [sage] 2020/02/23(日) 13:49:38.14
なんかToo Many Requestsの判定おかしくないか?
明らかに上限に達してないのにブロックされるんだが
名無しさん@お腹いっぱい。 [sage] 2020/02/23(日) 15:47:02.49
制限がより厳しくなったのでは?分からないけど
名無しさん@お腹いっぱい。 [sage] 2020/02/23(日) 18:40:51.62
要求間隔が短すぎると弾かれる。
少しあければ5分経ってなくても返ってくる。
名無しさん@お腹いっぱい。 [sage] 2020/02/24(月) 23:02:16.74
気持ち悪いくらいサクサク応答するな
今のうちにいろいろやっておくべきか
名無しさん@お腹いっぱい。 [sage] 2020/02/26(水) 14:26:12.32

ありがとう
今見たらアーカイブ自体が消えていたから取り直したら見れた
名無しさん@お腹いっぱい。 [sage] 2020/02/26(水) 19:35:58.41
ttp://https://gigazine.net/news/20200226-brave-show-404-web-page/
マジか
名無しさん@お腹いっぱい。 [sage] 2020/02/26(水) 20:37:40.94
まとめてとったやつも全部消えてる…
名無しさん@お腹いっぱい。 [sage] 2020/02/27(木) 00:26:30.17
20年以降に保存したのが見えないのか消えてんのか知らんけど
最後に保存したのが2019のものになってんな
名無しさん@お腹いっぱい。 [sage] 2020/02/27(木) 00:29:13.91
消えてないのもあるな
向こうでメンテか何かやってるだけか
名無しさん@お腹いっぱい。 [sage] 2020/02/27(木) 01:53:05.91
魚拓音痴の質問もいいのかな…

魚拓の確認でカレンダーを開いた時に緑丸のページは絶対に見れない仕様ですか?
自分で調べたら緑丸=リダイレクトはわかったのですが緑丸を見る方法が見つからなくて書き込みました
初心者過ぎる質問で申し訳ないです
名無しさん@お腹いっぱい。 [sage] 2020/02/28(金) 00:14:02.51
申し訳ないんだが「緑丸のページを見る」ってのが何を言いたいのかよく分からない
リダイレクト先のページがWayback Machineに保存されてたら見れるし、保存されてなかったら見れない、という仕様のはずだけど
名無しさん@お腹いっぱい。 [sage] 2020/02/28(金) 11:25:46.13
Yahooみたいなページの話なら
JavaScript無効化すれば見れるはず
名無しさん@お腹いっぱい。 [sage] 2020/03/02(月) 16:30:56.34

ダメみたいです
スマホで閲覧してるのですがjavasScriptをオフにしても特に変化はありませんでした
因みに調べているのはbekkoameというサイトです
214 [sage] 2020/03/03(火) 09:45:19.77
リダイレクト応答のコンテントボディが見たいとか、
そんなニッチな話かと思ったけどどうやら違うようだ・・・。

そもそもリダイレクトがどういうものか、質問者氏は理解されていますか。
他の URL を提示して「代わりにここを見よ」と指示するものですから、
リダイレクト自体にそれ以上の内容はありません。
Internet Archive のカレンダで緑色で表示されている、つまり
クロール時にリダイレクトが返された旨記録されているアーカイブを
開くと、数秒後にその当時リダイレクト先として示されていた URL の
アーカイブの読み込みが始まります。

いくらリダイレクト先として示されていたからと言っても、所詮は別の URL です。
当該 URL が Internet Archive にアーカイブされているかどうかは、
元の URL がアーカイブされていることとはあまり関係がありません。
名無しさん@お腹いっぱい。 [sage] 2020/03/05(木) 21:02:07.03
/save/ではなくて/web/2/でもToo Many Requestsが出るようになったっぽいね
名無しさん@お腹いっぱい。 [sage] 2020/03/08(日) 12:59:52.71
Summaryタブがあるドメインと無いドメインの違いって何なんだろ?
数年経ってるのに無いのもあれば、半年程度であるドメインもあるし
取得数って訳でも無さそうだしなぁ・・・
名無しさん@お腹いっぱい。 [] 2020/03/09(月) 08:46:14.85
本日で一旦、毎日やっていた作業を休止します。
名無しさん@お腹いっぱい。 [sage] 2020/03/09(月) 08:57:41.98
何の話だよ
名無しさん@お腹いっぱい。 [sage] 2020/03/10(火) 19:21:31.04
画像とかアーカイブするときのプログレスバー消えた?
名無しさん@お腹いっぱい。 [sage] 2020/03/12(木) 22:50:35.54
また改悪しやがったな
名無しさん@お腹いっぱい。 [] 2020/03/13(金) 05:03:41.08
なんか保存にすごく時間がかかる...
どうなってんだ
名無しさん@お腹いっぱい。 [sage] 2020/03/16(月) 00:16:36.92
使い物にならない
名無しさん@お腹いっぱい。 [sage] 2020/03/16(月) 08:06:34.04
The same snapshot had been made 38 seconds ago.
↑これ出てるのにAPIでは保存されていないことになってる
/save/でも保存できないし、できるのは保存済みアーカイブの閲覧だけか
名無しさん@お腹いっぱい。 [sage] 2020/03/16(月) 15:04:49.41
なんだアゴ
名無しさん@お腹いっぱい。 [] 2020/03/16(月) 21:11:50.13


いまどきアゴ勇のステマをやる人がいるとは!

勢い5万以上のスレをメールでお知らせするサービス、実施中!!
憧れボディをGETしたい!その夢、ボニックで!

新着レスの表示

2ch勢いランキング アーカイブ ネットサービス板ランキング

凡例:

レス番

100 (赤) → 2つ以上レスが付いている
100 (紫) → 1つ以上レスが付いている

名前

名無しさん (青) → sage のレス
名無しさん (緑) → age のレス

ID

ID:xxxxxxx (赤) → 発言が3つ以上のID
ID:xxxxxxx (青) → 発言が2つ以上のID

このページは2ch勢いランキングが作成したアーカイブです。削除についてはこちら