正規表現
: 正規表現 [正規表現] NGNG 正規表現 : 終了 [終了] NGNG 終了 : 名無しさん@お腹いっぱい。 [sage] NGNG /\s*終\s*了\s*/ : 名無しさん@お腹いっぱい。 [sage] NGNG oreillyの本読めば全てに限りなく近く分る。よって終了。 : 名無しさん@お腹いっぱい。 [] NGNG 板地害 : 名無しだよもん@カラアゲうまうま [sage] NGNG ttp://www.oreilly.co.jp/BOOK/regex/ : 名無しさん@お腹いっぱい。 [netasage] NGNG 釣り合いの取れた括弧にマッチする正規表現を教えてください。 () ((())) ((((())))) (()()) ((())(()())) : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現ってFAだけで実装してるの?PDAも使うの? : 名無しさん@お腹いっぱい。 [sage] NGNG 無い。 : 名無しさん@お腹いっぱい。 [sage] NGNG (・)(・) . .) ( ( Y ) : 性器表現 [sage] NGNG 性器表現 : 名無しさん@お腹いっぱい。 [sage] NGNG 限界までgrepやればいい気持ち : 名無しさん@お腹いっぱい。 [sage] NGNG 正則表現って訳してる本無かったっけ? : 名無しさん@お腹いっぱい。 [sage] NGNG 詳説正規表現に正則表現という言葉が出てきた気がする : はにゃーん☆ ◆ZoWSAKURAw [moe or die] NGNG Perl 5.6 以降なら、可能。 #! /usr/local/bin/perl @kakko = qw[() ()) ((())) (()())) ((((())))) (()()) ((())(()()))]; $regex = qr/[^()]*\((??{$regex})*\)[^()]*/; foreach (@kakko) { if(/^$regex$/) { print "Match: $_\n"; } else { print "Unmatch: $_\n"; } } : 名無しさん@お腹いっぱい。 [sage] NGNG でも、それ正規表現じゃないんじゃないの? 文脈自由文法のクラスでしょ? : 名無しさん@お腹いっぱい。 [age] NGNG それ言ったら、今の「正規表現」なんてそもそもの定義から外れちゃうような気がするぞ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 数学的文脈におけるいわゆる「正則な表現」だけで括弧の釣り合いにマッチさせるスレはここですか? : 名無しさん@お腹いっぱい。 [sage] NGNG ここは既に終了したスレです。 : 名無しさん@お腹いっぱい。 [age] NGNG いやん、正規表現がんばろー。 16>> 拡張正規表現で納得しろ。 : 名無しさん@お腹いっぱい。 [sage] NGNG そもそも正規言語は数をかぞえられないんだから、 拡張正規表現でもないでしょ。 : 名無しさん@お腹いっぱい。 [age] NGNG 拡張正規表現 = 「正規表現」の定義を拡張。;) : 名無しさん@お腹いっぱい。 [sage] NGNG 言った方がいいかどうかわからんが 16>> 逆だ : 名無しさん@お腹いっぱい。 [] NGNG /^(U).\/*&_$&&*_@&(&*@+|@_(@)(?!<>)_##[o-Q](.*O+)&^&%^#)#+#$/ : おむこさん志望 ◆QtGqCwfDSA [sage] NGNG いま glibc のマルチバイト回りをやってる人が書いたドキュメント ttp://http://lc.linux.or.jp/lc2001/papers/dfa-i18n-paper.pdf "> ttp://lc.linux.or.jp/lc2001/papers/dfa-i18n-paper.pdf ttp://lc.linux.or.jp/lc2002/papers/hasegawa0918h.pdf ttp://www.saiensu.co.jp/books-htm/ISBN4-7819-0374-6.htm には正則表現って書いてあった。 : 名無しさん@お腹いっぱい。 [] NGNG ttp://sorekika.com/dame.jsp?idx=352 : 名無しさん@お腹いっぱい。 [] NGNG question = ( to ) ? be : ! be; -- Wm. Shakespeare : 性器表現 [sage] NGNG 凸 : 山崎渉 [(^^)sage] NGNG (^^) : 名無しさん@お腹いっぱい。 [] NGNG 質問よいでしょうか・・・ 英辞郎の読み仮名を削除したいのですが、 {(←全角です)ではじまり}(←これも全角です)でおわる文字列を ごっそり置換したいのですが、どう表現すればいいのかよく わかりません・・・・ おしえてくださいおながいします : 名無しさん@お腹いっぱい。 [sage] NGNG 処理系は何? : 名無しさん@お腹いっぱい。 [sage] NGNG sed "s/{.*}//" < input > output では駄目かい? : 名無しさん@お腹いっぱい。 [] NGNG その解は1行に複数の対が出てきたときに破綻する : 名無しさん@お腹いっぱい。 [sage] NGNG 入れ子になっていない、かつsedが日本語に対応しているならば s/{[^}]*}// というパターンを使うのが楽。 : 30 [] NGNG Windowsなんですよね・・・xyzzyの置換使おうかと思ってたんですが あ、Pythonも使い方よくわからないけど(汗汗)入ってます # Pythonだとどうかくんですかね?? ダメだったらCygwinでも入れてやってみようと思います。 皆様有難う御座います。 : 名無しさん@お腹いっぱい。 [sage] NGNG 秀丸の置換使えば? : 名無しさん@お腹いっぱい。 [] NGNG perlぐらいうごかん? : あぼーん [あぼーん] NGNG あぼーん : 30 [sage] NGNG さんの方法で問題なく出来ました。 有難う御座いました。とりあえず、この表現の 意味をきちんと理解しとこうと思います。メモメモ・・・ ところで、さん、何故秀丸? : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [sage] NGNG BNF使え : エディタ何617 [sage] NGNG ttp://pc2.2ch.net/test/read.cgi/software/1040201710/641-643 より移行してきますた。 正規表現の話はこっちでしましょ。 俺には大した知識はないんだが。 >642 :名無しさん@お腹いっぱい。 mailto:[sage] :03/02/21 15:28 ID:esOQbptZ >なんのために [:alpha:] のような書式があるのかと子一時間 これは知らんかった。 テキストエディタの粋を脱しそうだが。 : エディタ何617 [sage] NGNG >643 :名無しさん@お腹いっぱい。 mailto:[sage] :03/02/21 15:31 ID:+tcoIlhs > >文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。 >どんなコードでも入力が同一なら出力も同一であるべきじゃないの? 後半はよくわからんが、文字クラスが文字コードに依存するのは当然のことだと思うぞ。 文字 a は a というアルファベットという意味があるわけではなく単なるコード(0x61)なわけ。 テキストエディタでは普段から文字コードなんて考える必要はないんだけど、 正規表現では [a-z] とすると Shift-JISなら [\x61-\x7A] EBCDICなら [\x81-\xA9] というふうに変わってくる。 当然文字コードに依存する。 ここで文字コードに依存せずに認識するとなると、EBCDICの場合 [a-z]=[\x81-\x89\x91-\x99\xA2-\xA9] になってしまって本来の [\x81-\xA9] にはならなくなってしまう。 そのために 642 のような [:alpha:] なんかが用意されている。 さもなければ文字コード共通正規表現用文字テーブルなんてものが必要になりかねない。 テキストエディタで扱う文字コードとして EBCDIC を例に出すのは適当ではないが。 エディタがしているのは文字コードを認識して表示するということで、 文字コードを変換しているわけではない。 もちろん明示的に変換(文字コードを変更して保存等)すれば変わる。 : 名無しさん@お腹いっぱい。 [sage] NGNG >文字クラスが文字コードに依存するって言うのは恥ずかしいことでしかないと思うんだが。 そりゃ確かに恥ずかしい。 でも [a-z] という表記が「小文字アルファベットの文字クラスを指定している」ものだと誤解して、 誤用しているほうがもっと恥ずかしい。 「-」を使った表記は文字コード上で連続した複数の文字を意味しているだけだから、 本当に文字クラスを指定しなければならないシーンでは [:lower:] や \l を使うべき。 代表的なエンコーディングでは偶然文字コードが連続しているから [a-z] で期待した動作になるので常用されているの。 : 名無しさん@お腹いっぱい。 [sage] NGNG [:alpha:] とかってウムラウトがどうたらとかいう話のためにあるのだと思ってた : 名無しさん@お腹いっぱい。 [sage] NGNG unicode などが本格的に使われ出して 多国語があたり前になったら [:Japanese:] とか [:Korean:] とか できるのかな。 : 名無しさん@お腹いっぱい。 [sage] NGNG その通り。 POSIX ではロケールによって変わるよ。 : テキ何618 [sage] NGNG 興味があるので誘導されてきました。 ってココは関連Linkないので張るね。 ●正規表現最新リンク集2003 ttp://www2.famille.ne.jp/~akio1998/l_grep.html ●正規表現メモ ttp://www.kt.rim.or.jp/~kbk/regex/regex.html で向こうのスレでの疑問で思ってたんですが、 | また正規表現の正しい、正しくないってあるのか? 上の引用についてずばり解決してくれる神はおられませんか? 向こうでも思ってたんだけど中途半端な正規化だから文字コードに 依存するって思ってたんですが。 : 名無しさん@お腹いっぱい。 [sage] NGNG >本当に文字クラスを指定しなければならないシーンでは > [:lower:] や \l を使うべき。 つーことは[B-Yb-y]は本当に文字クラスを指定せんといかんシーンでは [BCDEFGHIJKLMNOPQRSTUVWXYbcdefghijklmnopqrstuvwxyz] あるいは [^AZaz[:digit:](憶えとらんので略)] と書かねばならんわけか… : 名無しさん@お腹いっぱい。 [sage] NGNG [:alpha:] とかって、実際に実装されてるのあるの? : 名無しさん@お腹いっぱい。 [sage] NGNG ある正規表現が書かれた目的を果たせるかどうかで、正しい正しくないを言うことはで きるでしょう。ただし目的を果たすといっても厳密でなければならない場合やアバウト で大丈夫な場合と様々なレベルがあるわけで、ケースに応じて使い分けるのが大人とい うものです。 それから正規化しているから正規表現というわけじゃないです。ある有限オートマトン が受理する特定の言語(記号列)を正規言語と呼び、その受理される言語の全ての集合を 正規集合と呼び、その集合を表現する方法を正規表現と呼んでいるのです。文字コード 云々が問題になるのは、SJISやEUCのようなマルチバイトコードで表現された1文字を1 つの記号として認識しない正規表現エンジンがあるからで、またエンジンが認識する場 合でも利用者側が記号としての文字と文字コードとの関係を、[a-zA-Z] と [:alpha:] のようにゴッチャにしているからです。もっとも後者についてはマルチバイトには依存 しない話ですけれど。 厳密にはそういうことになります。メンドイのでそこまでする人は少ないでしょうが。 : エディタ何617 [ sage] NGNG | また正規表現の正しい、正しくないってあるのか? 俺なんかの知識じゃたいしたこと言えないが、現在においては統一的な正しさなんて無いと思う。 ものによって実装が違うから、egrepでは正しくedでは正しくないとかあろうね。 使い手が自分で何をしようとしているのか理解できているかどうかが問題になりそう。 Q「s/[A-z]//g としたら[や^まで消えてしまいました。この正規表現は間違っていますか?」 A「正規表現もパターンマッチの結果も正しいです。ただ、あなたの求めている正規表現ではないでしょう。」 >向こうでも思ってたんだけど中途半端な正規化だから文字コードに >依存するって思ってたんですが。 エディタは文字コードを勝手に認識してくれるからユーザーが考える必要はないけど、 文字クラスで[a-z]とかやる場合はどうしたって文字というより文字コードを扱うってことになる。 ただ、普通は上に書いたように[A-z]なんてやる奴はいないだろうから、 実質的には文字コードに依存していないかのように扱えるというだけだと思う。 ところで [a-z] として、これがどういう意味であって欲しいんでしょうか? : 名無しさん@お腹いっぱい。 [sage] NGNG [a-z] "a"の文字コードから"z"の文字コードまでの文字コードの文字のことかな : テキ何618 [sage] NGNG >51,52 すまん質問の仕方が悪かった。 上で正規表現の仕様が悪いみたいな雰囲気があったから疑問に おもったんですが、たとえば「grepの仕様は正しいが、awkの仕様は 間違ってる」みたいな正規表現の仕様上の問題で間違いというのが あるのかという疑問でした。 >[a-z] その正規表現で規定されているaのキャラクタからzのキャラクタまで。 文字コードでも文字でもないはずだ。 たとえばProxomitronなら[a-zA-Z]と同じようになるようにキャラクタの 並びが規定されている。 : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現が実装されているなら 実装の細部がgrepとawkでは異なるというだけで 正しいも正しくないもないんだってば。 : 名無しさん@お腹いっぱい。 [sage] NGNG 全然議論が噛み合ってないなぁ。 「正規表現」(オライリー)の一冊くらい読んでから出直してきて欲しいな。 でなきゃこんなの不毛だよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG > それから正規化しているから正規表現というわけじゃないです。ある有限オートマトン > が受理する特定の言語(記号列)を正規言語と呼び、その受理される言語の全ての集合を > 正規集合と呼び、その集合を表現する方法を正規表現と呼んでいるのです。文字コード これが理解できません。 : 名無しさん@お腹いっぱい。 [sage] NGNG >>[a-z] >その正規表現で規定されているaのキャラクタからzのキャラクタまで。 >文字コードでも文字でもないはずだ。 「aのキャラクタからzのキャラクタまで」ってのが文字コードそのものだと思うぞ。 「文字コードでも文字でもない」ってのが [:alpha:] なんじゃないの。 [a-z] だけ特殊な意味合いを持って欲しい、なんてことではないでしょう。 >たとえばProxomitronなら[a-zA-Z]と同じようになるようにキャラクタの >並びが規定されている。 絶対そんな規定されてないよ。 Proxomitronで規定されているのは「大文字小文字を同一視する」ってこと。 だから [a-Z] なんて書いても [a-z] と同等の文字コードの並びとして扱われる。 これは単にProxomitronの性質上、扱う文字列の大文字小文字を区別するより 区別しない方が圧倒的に多いということから独自に規定されたものだろ。 「文字でも文字コードでもない」として扱うためには、エディタ作者なりが 新たな文字の統一コードを規定していろんな文字コードに対応した変換表でも作り、 ユーザーは既存の文字コードの代わりに作者の規定したコードを理解して使うってことになるんじゃないか? : 名無しさん@お腹いっぱい。 [sage] NGNG 形式言語の教科書くらい読んでから来い : テキ何618 [sage] NGNG >55 ですよね、最近そういった話を耳にするんで敏感になってました。 きっぱり否定してくださって助かります。 51氏も分かりやすい説明ありがとうございます。 >58 それが正規表現関係の資料をいくら読んでも必ず「aのキャラクタから zのキャラクタまで」だったと記憶してます。 逆にコードで表記されてる資料がありましたら、ご提示願えませんか? # 日本語の資料だとよく文字コードの話もみます。 >「大文字小文字を同一視する」 の実装はどうされているのでしょうか? まさか一度さきに別に小文字を大文字に書き直して正規表現を当ては めてから元の小文字に戻すという芸当はされてないと思います。 私は憶測ですが正規表現上で小文字と大文字を同一文字だと規定し ているように思えます。 # 文字コードレベルだと高とはしご高の関係に近いと思います。 >59 お勧めのありますか? : 名無しさん@お腹いっぱい。 [sage] NGNG くらい通読して出直してから議論してくれよ。でなきゃこんなやりとり無駄だよ。 いや、煽りじゃなくてマジでさ。 : 名無しさん@お腹いっぱい。 [sage] NGNG の本って目次だけ見ると各ツールの「実装」について述べてる みたいだけど、正しい「定義」については載ってるの? : 名無しさん@お腹いっぱい。 [sage] NGNG 規格としては POSIX 1003.2 があるけど、 正しい定義なんてものはないと思う。 : 名無しさん@お腹いっぱい。 [sage] NGNG 『正しい「定義」』なんてないんだからおまいらの議論は不毛だって言ってんの。 中途半端な知識と思い込みだけの虚しい空論だよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG たしかに目次には各ツールの実装についての記述が目立つ。 だが、この本のキモは4章と5章だ。 君が正規表現をある程度自在に扱えるのであれば、 この二つの章を読むだけでも価値はある。 とりあえず話はそれからだ、と思うぞ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 文字クラス中の - が文字コードでの連続を表すか文字としての連続を表すかは実装依存です、 で終了。 : 62 [] NGNG いや、の言うように実装依存だと思ってたから、 正しい「定義」が載ってるなら、読んどこうかと思ったんですが。 の発言を(それまでの流れと併せて)読むと、さも載ってそうなんですが、 目次見たら(-_-)ぁゃιぃ…だったので。 : 名無しさん@お腹いっぱい。 [sage] NGNG ttp://www.opengroup.org/onlinepubs/007904975/basedefs/xbd_chap09.html 規格が「正しい」かどうかは別として… : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現の定義ねぇ。どうもどこかの団体がきっちりまとめた規格 のような「定義」を期待してるようだが、このあたりのハナシは計算 機科学色が強いから定義など教科書の数だけある、と言ってみるテスツ。 本質はみな同じのはずだけどナ。 しかも見慣れぬ数学記号飛び交う抽象的な議論になるから、 オライリー本で充足しているヤシにはカルチャーショックだろう。 大学の図書館でも逝け。 : 61 [sage] NGNG > の発言を(それまでの流れと併せて)読むと、さも載ってそうなんですが、 > 目次見たら(-_-)ぁゃιぃ…だったので。 漏れの発言を勝手な解釈すんなよ。 正しい「定義」なんて載ってるわけないだろ。正しい「定義」なんてないんだから。 : 61 [sage] NGNG ていうかあれだ、「定義」の話じゃなくて「規格」の話をしたいのか? 「定義」の話なら、 の言うように、 計算機科学(の世界だと「正則表現」の方が通りが良いか?)の本でも 紐解いて読んでみるのが良いと思う。 そうでなくて、単に、 文字列バターンマッチに使われる「正規表現」の正しい「規格」の話、 ってことなら、そんなものは無い。 強いて言えば、 くらい。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「定義」=「決め」でしょ。 その場その場で都合のいいように「定義」するわけだから 「正しい『定義』」なんてのはあるわけがない。 : 名無しさん@お腹いっぱい。 [sage] NGNG じゃ、まずは「正しい」の定義から始めようか。 : 61 [sage] NGNG というわけで、このスレは、「ホップクロフト&ウルマンを輪読するスレ」になりますた。 : 62 [sage] NGNG 規格として[a-z]の解釈について正しい定義はあるのか? っていう議論中に、「コレ読め」と言われたら載ってるように 見えても仕方ないと思うんですがねぇ。 「に載ってないから無い」、とは言えんでしょ。 何の為に読めと言ったのか聞いてよろしい? : 名無しさん@お腹いっぱい。 [sage] NGNG POSIX 1003.2 に厳密に従っていればこれにある通り。 ttp://www.linux.or.jp/JM/html/LDP_man-pages/man7/regex.7.html が、世にある実装は大抵そうでない。 : 名無しさん@お腹いっぱい。 [sage] NGNG 見た感じ、EBDICでもロケールが英語なら[a-z]は 英小文字のセットとして評価されるべきみたいですな。 : 名無しさん@お腹いっぱい。 [sage] NGNG 全く違う。 そもそも君の話は正しい定義がこの世に存在する事を 前提としている。しかし実際はそのようなものは ないわけだ。(「正しい」の意味が私の考えている ものと違うならわからないが) そのことを理解するために(というか議論のための 基礎知識を得るために)読んでおくべきと 61 は 言いたかったのだと勝手に解釈してみる。 厳密な定義という意味で正しいと言っているなら 計算機科学の教科書をひもといてみるといいかもなあ。 : 名無しさん@お腹いっぱい。 [sage] NGNG >75 そんなマヌケな話を避けられるようになるよ、 とそういう意味で勧めてくだすったんだろう。 : 75 [sage] NGNG >そもそも君の話は正しい定義がこの世に存在する事を前提としている。 シテネーヨ。 つーか著名ツールの実装に関する本を読んだ所で、 [a-z]の解釈は〜という議論に決着つくのですか。 1-60までのスレの流れと、の勧めたの内容を 良く見てから出直して下さい。,79 : 名無しさん@お腹いっぱい。 [sage] NGNG 取り合えず読んでみる、と言う選択肢は 意図的に無視されているのだろうか… : 名無しさん@お腹いっぱい。 [sage] NGNG もともと [a-z] なんていう表記は、素な正規表現/正則言語にはない。 でもそれじゃ面倒だから - で繋いだ2つの文字の間の文字群を略記する方法が、 及び実装としては単に文字コードを繋ぐ方法がデファクトスタンダードになった。 それを勘違いしたバカが [a-z] は論理的なアルファベットを意味すべきだとか言い始めて [[:alpha:]] や \l やら \a が導入されるようになったり、変な挙動をする実装もでてきたかもしれん。 でここでPOSIXなんて有名無実なものが定義されたわけだ。 なのにさらにバカが [a-z] の正しい解釈、定義を教えろとかいう。 やれやれだ。 : 名無しさん@お腹いっぱい。 [sage] NGNG ここは62=75の脳内正規表現を研究するスレになりますた。 # 素直に勉強してから出直せばいいのに。。。 : 62=75 [sage] NGNG やれやれとはこっちが言いたい。 [a-z]の解釈が文字コード依存なのは承知済みだっつーの。 のタイミングで論議を不毛と評しつつ、正規表現の本読めと 言われたら、規格か何かが載ってるとしか思えんでしょうが。 著名ツールの実装見たところで、議論の不毛を悟れますか? : 名無しさん@お腹いっぱい。 [sage] NGNG 少なくとも読めば実装により異なることは察することができたかもね : 名無しさん@お腹いっぱい。 [sage] NGNG 規格自体を読みたいなら68にリンクがあるし、なんでそう粘着してるんだろうか : 名無しさん@お腹いっぱい。 [sage] NGNG なぜに著名ツールの実装しか載っていないと決めつけ 勝手な解釈で話を進めるのだろう? とにかくおかしな前提と曲解が多い上に粘着だ。 : 名無しさん@お腹いっぱい。 [sage] NGNG もう放置しようよ……。 : 名無しさん@お腹いっぱい。 [sage] NGNG 非放置国家 2ch : 名無しさん@お腹いっぱい。 [sage] NGNG 決め付けてませんが。 で実装以外の内容(具体的に規格など)は 載って無いかと聞いてるんだし。 おかしな前提・曲解・粘着は認めますがね。 で、偉そうに読めとか言ったは何処逝ったの? : 名無しさん@お腹いっぱい。 [sage] NGNG > で、偉そうに読めとか言ったは何処逝ったの? 読んだら出てくるんじゃねーの? : 90 [sage] NGNG とっくの昔に読んでいるんだが… (立ち読みでざっとだけど) : 名無しさん@お腹いっぱい。 [sage] NGNG 形式言語系の本は読んだのかYO! : 名無しさん@お腹いっぱい。 [sage] NGNG そんなの読んだうちに入らん。 : 名無しさん@お腹いっぱい。 [sage] NGNG 理屈が通用すると勘違いせず、粘着は放置しましょう : 名無しさん@お腹いっぱい。 [sage] NGNG 腹が減ってるもんで こんなのでも食いついてしまうんです。 : 名無しさん@お腹いっぱい。 [sage] NGNG 君が何を知りたいのか、 おじさんわかんなくなっちゃったよ。 ここらでひとまず 疑問点を整理して箇条書きにしてみないか? : 名無しさん@お腹いっぱい。 [sage] NGNG 技術系の本を立ち読みしただけで読んだ気になれる人には 何を言っても無駄ではなかろうか。 : 山崎渉 [(^^)] NGNG (^^) : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [age] NGNG 『詳説 正規表現 第2版』 ISBN4-87311-130-7 本体価格5,400円 が5月に : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [sage] NGNG おっ。 ソースどこ? : 名無しさん@お腹いっぱい。 [sage] NGNG 定義うんぬんよりも、便利な方がいい。 というわけで、 (?# (?: (?= (?! (?<= (?<! (?> (?() : 名無しさん@お腹いっぱい。 [age] NGNG オライリーのメルマガ : 名無しさん@お腹いっぱい。 [] NGNG 正規表現(regular expression)の名前の由来はなに? regularをなぜ正規と略したんだろう? 「正式にきめられていること。正式の規定」という意味の正規では 幾分意味不明なんじゃないだろうか? むしろregular verb(規則動詞)の意味のregularと捉えるべきで、 「規則表現(法or式)」とでもした方が文字列の規則性を規則的に表現するもの という意味でより素直で的確なんじゃないだろうか。 ここにはnormal distributionを正規分布と略し日本語としては 意味不明にしてしまったのと同様のセンスの無さが感じられる。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「function」を「関数」と訳すアフォといっしょだろ。 : 名無しさん@お腹いっぱい。 [] NGNG regular に合うような日本語単語を考えると 正規、正則、規則、規律、規則的、整然、合式、本格的、定常、完全、定例 などが挙げられる。 正規に違和感を感じるのは同意。 ただし、規則だと regular より rule の方を感じる。 regular expression を長々と訳すならばオレテキには 規則正しい表現法 となるが、あとはそれをどのように短くするかだ。 正規表現には違和感あるが 規則表現にはさらに違和感ある。 規則正しい生活を規則生活と省略するのに似ている。 : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [age] NGNG わたしは特に違和感ない。 複数の体系の共通項的要素を抽出して、どれをもあつかえる 単一の体系にまとめることをCS的に正規化というでは? : 名無しさん@お腹いっぱい。 [sage] NGNG 正則表現といわれたほうがシックリするわ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「函数」が正解、という主張ならそれは翻訳の問題ではなく 日本の戦後国語教育の問題なわけだが : 107 [sage] NGNG > 「函数」が正解、という主張なら 違う。 : 名無しさん@お腹いっぱい。 [sage] NGNG それならそれで108なみ詳細な解説きぼんぬ : 113 [sage] NGNG > それならそれで108なみ詳細な解説きぼんぬ どきっ!! い、いやぁ、「function」は普通に訳したら「機能」じゃないかなぁ〜、 なんて思うので。 なんで、「関数」になったのか疑問なので。 やっぱり、かっこいいからかなぁ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 数学方面なら「正則」とするところなのに、情報数学方面では「正規」の方が 定着しているということなのか? 数学で既に訳語があったからという単純な話なんでは。函数→関数の 書き換えはまた別の話だが。古い先生だと「関数」の表記を絶対使わない人 もいるね。自分も函数の方がいいと思う : 名無しさん@お腹いっぱい。 [sage] NGNG 中国語が英語から「function」という英単語を輸入するとき それを「函数」と翻訳した。 函は中国語で「ファン」と発音し「function」の「ファン」に似ているところからきている。 そのあと日本は中国から「函数」という言葉を漢字で記述された文字として輸入した。 そして「函」を「カン」と発音した。 戦後の日本の教育において「函」が教育仕様内の標準的漢字から外れるという理由から およそ同義で同音の「関」に置き換えられた。 すなわち「function」の「fun」を元にしてその部分は 以下の経緯で「関」に変わった。 英語の「fun」 ↓発音の類似性から 中国語の「函」(ファン) ↓同じ文字 日本語の「函」(カン) ↓発音の類似性から 日本語の「関」(カン) こういう改変に次ぐ改変で「関数」という言葉が生まれた。 もはや「関数」という言葉にはそう表現する適切な理由がない。 情報系の技術屋なら「function」ないし「ファンクション」 と表現すれば良いのだ。どうしても漢字で書きたければ「機能」で良し。 「関数」だなんていい加減な言葉を使うなら 「class」を「学級」とでも表現してくれた方がまだましと言えよう。 : 名無しさん@お腹いっぱい。 [sage] NGNG 函(はこ)の数と意味も掛けてあるから、やはり捨て難い訳ではある : 名無しさん@お腹いっぱい。 [age] NGNG classは「級」でいいはずだけど、「きゅう」ではみじかすぎて わからんからそのまま「くらす」。 : 名無しさん@お腹いっぱい。 [sage] NGNG くらす、きさん!! : 名無しさん@お腹いっぱい。 [sage] NGNG もう「関数」で慣れちゃってるからなぁ。 「機能」と訳したところで 意味がわかりやすくなるわけでもないし。 「正規表現」にしても「関数」にしても おれにとってはある概念に対するラベルでしかない。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「関数」は一つの名詞なので、 一旦覚えてしまえば 「関数」という訳について不自然さは感じにくい。 でも「正規表現」は「正規」と「表現」の複合語であるから、 正規な表現? という意味不明さはいつまでも残る。 : 名無しさん@お腹いっぱい。 [sage] NGNG "regular expression" というからには regular じゃない expression もあるんでしょうか? たとえばどんなのですか? : 名無しさん@お腹いっぱい。 [sage] NGNG fgrepに書く検索パターン : 名無しさん@お腹いっぱい。 [sage] NGNG プログラミング用語での function は単なる「機能」ではなく、 数学的な(値を返す) function としてのニュアンスが込められているんじゃ ないのかなあ? 関数型言語ではいうに及ばず、FORTRAN とかでもそんな感じだし、 C だってもともと void 型なんてないし。 # 正規表現と関係ないので sage : 名無しさん@お腹いっぱい。 [sage] NGNG 「機能」も造語っぽくない? 明治あたりの。 : 名無しさん@お腹いっぱい。 [sage] NGNG 関数が函数の書き換えだと知ったとき、小学校の算数の時間で関数の 説明に「ブラックボックス」という言葉を使っていたのを思い出した。 この書き換えは最悪だと思ったな。 しかし、いくら原語が同じだとしても、関数と機能は日本語としては完全に 別物になってしまっている。function key の function は、やはり「機能」の 意味でないと落ち着かない。 「正則」は、ほとんど術語としてでしか使われることがないけど、「正規」は 普通の文章でも使われるからね。「正規」と「表現」の結び付きが強くなって しまう。 : 名無しさん@お腹いっぱい。 [sage] NGNG expression にしても、「式」とも訳される場合もあって悩ましいことこの上なし : 名無しさん@お腹いっぱい。 [sage] NGNG じつは日本語って、語彙が豊富? まぁ、ほとんど訳語だけど。。。 : 名無しさん@お腹いっぱい。 [sage] NGNG > function key の function は、やはり「機能」の意味でないと落ち着かない。 それは「function key」を「関数キー」と読んでる人に言ってくれ。いるのか? Google で検索しても 163 件しかない上に、関数電卓の「関数キー」 (sin 関数のキーとか) だの「ハッシュ関数のキー」だのばっかりなのだが。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「ファンクションキー」と言ってるのしか聞いたことがないが、この「ファンクション」 は「機能」の意味でないと落ち着かないと言ってるだけだ : 名無しさん@お腹いっぱい。 [sage] NGNG 自国語で数学的概念を表現できる国は少ないほうだと思われ。 微分、積分、階乗、無理数、有理数、etc... functionに対する訳で機能と函数で揉めるのは贅沢なことなんじゃないのかなぁ…… ていうか、算数、数学の教科書が日本語だけで完結できること自体、 ほかの国から見ると不思議なことなんじゃないの? : 名無しさん@お腹いっぱい。 [sage] NGNG 何の話をしてるんだか・・・ : 名無しさん@お腹いっぱい。 [sage] NGNG では、日本における性器表現についてどうぞ ↓ : 名無しさん@お腹いっぱい。 [sage] NGNG [まち]んこ : 名無しさん@お腹いっぱい。 [sage] NGNG \(藁田\|ワ[ロラ]タ\) : 名無しさん@お腹いっぱい。 [sage] NGNG こういう日本語の正規表現の使える実装にはどんなのがありますか? Ruby, 鬼車, jperl, xyzzy, Emacs, あたりは使えると思うけど、ほかには? : 名無しさん@Vim%Chalice [sage] NGNG Vim : 名無しさん@お腹いっぱい。 [yosage] NGNG perlとかなら /(ma|chi)nko/i みたいに i オプションつけることで 大文字小文字を同一視してくれる機能が一般的に普及してますね。 grepとか大抵の性器表現できるツールにはあるみたい。 そこでほしいのが平仮名片仮名同一視。 /[まち][んむ]こ/i とすれば「マむコ」にも「チンこ」にもマッチしてほしいわけ。 そういう機能がついた性器表現ってどういうツールにございますか? あと /ベートーヴェン/i で検索したら 「ベートーベン」や「べえとおべん」にもマッチしてくれる ようなのもあるものでしょうか? : 名無しさん@お腹いっぱい。 [sage] NGNG 後者は正規表現の範疇ではないような。 前者はあってもよさそうだね。 : 名無しさん@お腹いっぱい。 [sage] NGNG 文字クラスの拡張でしょうか : 名無しさん@お腹いっぱい。 [sage] NGNG 日本語用文字クラスってわけね。 しかしそんな日本でしか使えないもんはツールで対応すべきだな。 >/ベートーヴェン/i >で検索したら >「ベートーベン」や「べえとおべん」にもマッチしてくれる こんなん正規でも正則でもない非正規表現だ。 は正規表現使うのやめた方が幸せになれそうだよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG Migemoの辞書をカスタマイズすればできるようになるよ : 名無しさん@お腹いっぱい。 [sage] NGNG そういう問題じゃなかろう・・・ : 名無しさん@お腹いっぱい。 [sage] NGNG 日本語正規表現の使える実装は Ruby, 鬼車, jperl, xyzzy, Emacs, Vim で全てですね? : 名無しさん@お腹いっぱい。 [sage] NGNG いいえ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 文字クラスとか自分で設定できる正規表現みたいなのが あればいいんじゃないの。 どうせ perl だって場あたり的に好きなように拡張してるんだから。 : 名無しさん@悩み中 [] NGNG sed ですが、 [[:xdigit:]]\{2\} にマッチする文字列のなかで、 \(61\|75\|6f\) にマッチしないようなものを指定したいとき どないすればよろしい? : 148 [] NGNG やっぱり、先に \(61\|75\|6f\) にマッチする奴を退避しておいてから、 [[:xdigit:]]\{2\} にマッチするやつを指定するしかないんかな… : 名無しさん@お腹いっぱい。 [sage] NGNG 誰か、正規表現だけで会話するスレ作ってくれ。 : 名無しさん@お腹いっぱい。 [sage] NGNG /いったい何を会話するというのだ/ : 名無しさん@お腹いっぱい。 [sage] NGNG それこそ言いだしっぺの法則だろ。正規表現だけで会話したい が立てれ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 駄スレ立てんな。 : 名無しさん@Meadow [sage] NGNG $mes153 =~ s/。//; reverse(split(//, $mes153)); わかた? 結果は、「なんてつたレスだ」 : 名無しさん@お腹いっぱい。 [] NGNG こうなりますた。 $ perl -e 'quotemeta($var='駄スレ立てんな。'); print reverse(split(//,$var));' B∧んてぉ洛スμ・ : 名無しさん@お腹いっぱい。 [sage] NGNG 名スレの予感 : 名無しさん@Meadow [sage] NGNG jperlじゃないとだめですね。perl用もかきますた。 ($var='駄スレ立てんな。') =~ s/立(.+)。/たつ$1/; while ($var) { if ($var =~ s/^[\xA1-\xFE][\xA1-\xFE]// or $var =~ s/^.//) { push(@str, $&); $var = $'; } } print reverse(@str), "\n"; : 名無しさん@お腹いっぱい。 [] NGNG 2chですから、性器表現とこれを用いた強制痴漢ならあちこちに。 : 名無しさん@お腹いっぱい。 [sage] NGNG \hなのはいけないと思います! : 名無しさん@お腹いっぱい。 [sage] NGNG \SM(?:性器拡張(?!器具)) : 名無しさん@Meadow [sage] NGNG 何やってんだろな、漏れ。 ($var='駄スレ立てんな。') =~ s/立(.+)。/たつ$1/; while ($var =~ s/^[\xA1-\xFE][\xA1-\xFE]// or $var =~ s/^.//) { push(@str, $&); } print reverse(@str), "\n"; で十分だった。この全角文字対応の正規表現は、euc-jpの奴ね。 でもさ、やっぱ正規表現で会話するってむずいよ。よ。 : 名無しさん@お腹いっぱい。 [s/つーか全角空白使ってる時点でダメダメ/sage/;] NGNG print while s//普通過ぎてつまらん/; : 名無しさん@お腹いっぱい。 [sage] NGNG それは正規表現ではなく perl script というのではないだろうか。 : 名無しさん@お腹いっぱい。 [sage] NGNG の的確すぎるツッコミに藁。 : 名無しさん@お腹いっぱい。 [sage] NGNG これら全てが正規表現であることは自明なのであります。 : 名無しさん@お腹いっぱい。 [sage] NGNG Perl正規表現の質問です。 Ascii文字コードは、アルファベット大文字→ちょこっと記号類→アルファベッ ト小文字の順に並んでるですが、以下のようになるのはなぜですか。なぜ、ア ルファベット大文字しか出てこない? $ perl -e 'for(A .. z) {print $_, ", ";}' A, B, C, D, E, F, G, H, I, J, K, L, M, N, O, P, Q, R, S, T, U, V, W, X, Y, Z, : 名無しさん@お腹いっぱい。 [] NGNG 駱駝本(第二版)の p.103 の脚注 *32 に、 > もし指定された最終値が、マジックによる増加によっては生成できない > ような値なら、最終値のケタ数を超えない範囲で値を生成する。 と書いてあるけど、違う? : 名無しさん@Meadow [sage] NGNG ありがとん。 >マジックによる増加によっては生成できない というのが分からなかったので、駱駝本(第3版)引いたら、「マジックイン クリメント:普通の数値と同じようにして、英数字からなる文字列の値に「1 を加える」方法を知っているインクリメント演算子のこと。」だって。Aは、 16進数で41、Zは、5A。5B以下60までは、[、\, ], ^, _, `で、61から小文字。 一つずつインクリメントされて並んでいるが、できないところを見ると、「英 数字からなる文字列」だけをサポートしている演算子なんだね。 第2版の103ページにあたる121ページあたりにも、A .. Zやa .. zの例はある けど、A .. zはない。 : 名無しさん@お腹いっぱい。 [sage] NGNG 文字のインクリメントもちゃんと桁上げされるんよ。 #perl > result.txt $a = "a"; print ++$a, "\n" while (length $a < 3); : 169 [sage] NGNG あ、これじゃ for (A..Z) の説明にはならないな。 : 名無しさん@お腹いっぱい。 [sage] NGNG 全然正規表現じゃなかった・・・。 : 名無しさん@お腹いっぱい。 [sage] NGNG /\x82\xad\x82\xbb\x82\xc1/ sjis : 名無しさん@お腹いっぱい。 [sage] NGNG パターンマッチさせる意味は? : 名無しさん@お腹いっぱい。 [sage] NGNG 1) ネタがないから 2) わし166だので、172に揶揄されて「くそっ」と : 名無しさん@お腹いっぱい。 [sage] NGNG ちがった、171にバカにされて・・・ ~~~ : 名無しさん@お腹いっぱい。 [sage] NGNG おまえらみんな(ち|い|う)んぽ。 : 名無しさん@お腹いっぱい。 [] NGNG 『詳説 正規表現』を読んでいるようなエキスパートの人に質問です。 「"a" が偶数個、"b" が奇数個含まれる、すべての文字列を表す正規表現」 って分かりますか? 自分は答えを見てもよく分かりませんでした。 : 名無しさん@お腹いっぱい。 [sage] NGNG まずどのような「状態」があるのかを考える。この場合は 1. aが偶数個、bが偶数個 2. aが偶数個、bが奇数個 3. aが奇数個、bが奇数個 4. aが奇数個、bが偶数個 で初期状態が1でゴールが2となる。 まず最初に1から2に行くには /b/ の1通り。aが来ると4に行く。 4からスタートして1もしくは3を経由し2へ行く最短パターンは /(aa|bb)*(ab|ba)/ 以上から /b|a(aa|bb)*(ab|ba)/ が状態2に行き着く最短パターン。←第1段階 次に状態2からスタートして考えると /aa/ で3を経由して2へ戻り、 /bb/ で1を経由して2へ戻り、/ab|ba/ では4へ行ってしまう。 4へ行ってしまった後は先に考えた「2へ行く最短パターン」で帰って来れるので、 2から始まって2に戻るパターンは /aa|bb|(ab|ba)(aa|bb)*(ab|ba)/ となる。 これは0回以上起こり得ることを考慮して第1段階と結合すると /(b|a(aa|bb)*(ab|ba))(aa|bb|(ab|ba)(aa|bb)*(ab|ba))*/ : 名無しさん@お腹いっぱい。 [sage] NGNG 余裕があれば一度オートマトンに関する本を読んでみて。 ttp://http://www.amazon.co.jp/exec/obidos/ASIN/4320029488/ref=sr_aps_b_1/249-5563000-9397957 "> ttp://www.amazon.co.jp/exec/obidos/ASIN/4320029488/ref=sr_aps_b_1/249-5563000-9397957 の前半はすごくわかりやすいよ。 そこまでしなくても、一度 ttp://katsu.watanabe.name/grep/p7.html みたいな状態遷移図にしてみるといいかも。 : 177 [sage] NGNG 自分がこの問題を見たのは古い UNIX MAGAZINE で、内容を簡単に引用しますと … 偶数か奇数かを調べるには文字の数を2で割った余りが0か1かという 決まった2つを調べればよいため、正規文法で記述することが可能。 なお、この文法では a に関して2つ、b に関しても2つの場合があるので、 2 x 2 = 4 つの記号(状態)を用いる。 A → aB B → aA C → aD D → a A → bC B → bD C → bA D → aC A → b D → bB 状態 A … a が偶数個で b が奇数個の文字列 状態 B … a が奇数個で b が奇数個の文字列 状態 C … a が偶数個で b が偶数個の文字列 状態 D … a が奇数個で b が偶数個の文字列 以上により答えは ((a|b(aa)*ab)(b(aa)*b)*(a|ba(aa)*b)|b(aa)*b)*((a|b(aa)*ab)(b(aa)*b)*ba|b)(aa)* となる。 正規表現でうまく表現できない問題に当たったときは、いったん正規文法で記述してから 正規表現に変換すると解決できる場合も多い。 : 長いので分割。 [sage] NGNG … だそうです。 果たして↑の長い正規表現が さんの答えと同じものを表しているのかどうか 分かりませんけども。 有用な本と URL の紹介、ありがとうございました。 それにしても最初にパッと見て「この問題は有限個の状態で表せる」って思いつくかなぁ? 不思議だ。 : 名無しさん@お腹いっぱい。 [sage] NGNG > それにしても最初にパッと見て「この問題は有限個の状態で表せる」って思いつくかなぁ? それはパッと見というよりは、冷静に分析してわかるものでしょ。 慣れれば一瞬で分析できるようになるかもしれんけど。 : 名無しさん@お腹いっぱい。 [sage] NGNG ,180 それは「aとbだけからなる文字列」について? : 名無しさん@お腹いっぱい。 [sage] NGNG んなもん s/[ab]/[^ab]*&/ すりゃ良いだけじゃん : 名無しさん@お腹いっぱい。 [sage] NGNG それって、正気表現でつか? : 名無しさん@お腹いっぱい。 [sage] NGNG のために [^ab]* をはさみまくってたら、 「長すぎる行があります!」 っておこられたよ・・・ : 名無しさん@お腹いっぱい。 [sage] NGNG /[^ab]*(b|a([^ab]*(a[^ab]*a|b[^ab]*b))*[^ab]*(a[^ab]*b|b[^ab]*a))([^ab]*(a[^ab]*a|b[^ab]*b|[^ab]*(a[^ab]*b|b[^ab]*a)([^ab]*(a[^ab]*a|b[^ab]*b))*[^ab]*(a[^ab]*b|b[^ab]*a)))*/ : 名無しさん@お腹いっぱい。 [] NGNG それで baaabaaab がまっちすんの? : 名無しさん@お腹いっぱい。 [sage] NGNG 以下のようなデータから、著者の部分(最後の括弧から括弧まで)を 取り除きたいと思います。 木立(こだち)のなかに(夏目弱石) 山の上の芋粥(いもがゆ)(芥川蛇の介) s/(.+?)$//; ですとうまくいきません。perl5.6で、文字コードはeucです。 webprog板のPerl初心者スレで聞いたのですが、どうも解決しないのです。 どうしたらよいか教えていただければ幸いです。 : 名無しさん@お腹いっぱい。 [sage] NGNG セイキヒョーゲンの問題ではなくパールの問題っぽいですね。 そっちのスレ行った方がよいかも。 できるなら「うまくいきません」を再現させる できるだけシンプルなコードを添付してほしいな : 名無しさん@お腹いっぱい。 [sage] NGNG プログラム技術板にPerlの質問スレがある。webprogに特化したこと以外はそっ ちの方がいい。 s/([^()]+?)$//; : 名無しさん@お腹いっぱい。 [sage] NGNG Perl の正規表現では ( ) は、後で \1, \2, ... にマッチさせるための メタ表記だから、括弧そのものにマッチさせたければ \( \) と書かなければ ならない。(egrep や emacs とは逆) : 名無しさん@お腹いっぱい。 [sage] NGNG では、Perlスレ行ってきます。って、unix板にはなかったんで、 プログラム板ですね。ありがとございますた。 : 名無しさん@お腹いっぱい。 [sage] NGNG あれれ板探してたら、2つもレスが。 それ、jperlなら動くんでしょうが、perl5.6ではだめでした。 いや、全角括弧なんです。 : 名無しさん@お腹いっぱい。 [] NGNG それは \x28 や \x29 の場合だけでしょう。 今でてきてるのは \xa1\xca と \x1a\xcb。 ちなみにperlの最短一致は マッチの先頭位置を後ろにずらす効果がないので注意。 ($b="abcabc")=~s/b.*?c$//; print "$b\n"; # output "a" 189の要望はここで"abca"を出してほしいということで叶わない : 189 [sage] NGNG >perlの最短一致は >マッチの先頭位置を後ろにずらす効果がない なるほど。では、のコードは、 木立 山の上の芋粥 を出力してもいいはずですが、何も出力しない(何にもマッチしない)んです。 どうしてですか。よろしければ教えてくらさい。 : 名無しさん@お腹いっぱい。 [sage] NGNG s/(.+)(.+)$/\1/; : 189 [sage] NGNG これだと、 木立 山の上の芋粥 になってしまいます。求めているのは、 木立(こだち)のなかに 山の上の芋粥(いもがゆ) です。 : 197 [sage] NGNG マジ? 手元の Perl 5.005_03 だと求めているのになるのだが・・・ : 189 [sage] NGNG すみませ〜ん。 求めているものになりました。いろんなスクリプト混ざり合ってたので 混乱しました。 (.+)が最長一致するから(.+)でいいってことに気づきませんでした。 : 名無しさん@お腹いっぱい。 [sage] NGNG perlの正規表現と日本語文字列との相性の悪さを 実感する問題だったなあ : 192 [sage] NGNG 本当に全角だったのか。失礼。だとすると、/(/ が EUC の 2 バイト目と 文字に一致するとは限らないので注意。全角文字の 2 バイト目と次の文字の 1 バイト目がそれぞれ \xa1 と [\xca-\xcb] にマッチする場合があるので、 文字列「検便」\b8\a1\xca\xd8 にも「(」がマッチしてしまう。 日本語 EUC の 1 文字 にマッチさせたいなら、厳密には (\x8f?[\xa1-\xfe]{2}|\x8e[\xa1-\xfe]|[\x00-\xff]) にマッチさせなくてはならない。 Perl6 の国際化された正規表現が普及して、こんな知識は不要になって くれれば一番いいのだが…。 : 192 [sage] NGNG この例の場合、最後の括弧の中は全角ひらがなしか入らないから関係ないけどね。 : 名無しさん@お腹いっぱい。 [sage] NGNG 5.8ならuse utf-8; use Encode;して適切なエンコード指定でファイル読み込ませれば解決するぞ。 : 名無しさん@お腹いっぱい。 [] NGNG ttp://61.210.205.4/ これなんだろ@@@ : 名無しさん@お腹いっぱい。 [] NGNG WebProg板の「正規表現道場@2ch Part2」はご存知? ttp://pc2.2ch.net/test/read.cgi/php/1038146241/ : 189 [sage] NGNG 知ってます。最近、書き込み少ないので、こっちにしました。 あっちでは、以前、いろいろ答えてあげてたんですが。 実は、他のやり方ならいろいろ考え付いたのですが、 s/(.+?)$//; がなぜだめかが知りたくて質問したのでした。 だけがその質問に答えてくれました。そいえば、それも らくだ本で読んだ覚えあったなぁと。しかし、「最短一致がマッ チの先頭部分を後ろにずらしてくれない」という理由ですと、 なぜ、「木立(こだち)のなかに(夏目弱石)」が、「木立」 にならないか、いまだに不明です。($b="abcabc")=~s/b.*?c$//; で$bが'a'になるんだから、そうなってもいいはずですよね。 # でも、3つのスレで「()をエスケープしろ」っていう返事をもらったのにも # びっくり。漏れは、navi2chなので、半角と全角は一目瞭然ですが、IEで見 # てみたら、たしかに女滋養に見えますた。 : 名無しさん@お腹いっぱい。 [sage] NGNG 女滋養(;´Д`)ハァハァ : 名無しさん@お腹いっぱい。 [sage] NGNG 生粋のプログラマーなら日常的に半角全角の違いがすぐ分かる環境を望む。 そうじゃない人はあまり気にしないので女痔用に見えても兵器。 : 名無しさん@Meadow [sage] NGNG 女痔用 (´;。;△;。;)キモ!!!!!!!!!!!!!!! : 名無しさん@Meadow [sage] NGNG 漏れは、navi2chでも迷ったっぞい。 : 189=207 [sage] NGNG はっきり言っておくんなさい。 たすかに、fontの問題かもすれんですよ。 だかーら、記号類は半角とか全角とか注釈つけとけと… でもって、半角カタカナなんか問題ない時代になったんだなー、と。 : 名無しさん@お腹いっぱい。 [] NGNG 半角か全角かをいちいち説明されないと違いの分からないような 素人さんにはそもそも質問なんかされてないんですよ : 名無しさん@お腹いっぱい。 [sage] NGNG 189が意図的に使い分けてるという保証もなかったわけだが。 : 名無しさん@お腹いっぱい。 [sage] NGNG はじめから euc と断ってたし、 対象テキストデータとか試しに提示したダメコード片を良く見れば、 意図的に使い分けてることは十分想像できたと思うが。 質問の仕方や内容からも半角全角混同してるようなレベルの質問とは思えなかった。 つうか、 は何をいまだにハマってるんだ? s/(.+?)$//; なら「木立」になるから問題なかろう? : 191=214 [sage] NGNG 一応そう想定して答えた。 : 名無しさん@お腹いっぱい。 [sage] NGNG 釈迦に説法か。スマソ : 189=207 [sage] NGNG いえ、それが、全行出力されちゃうんです。 ちょっと、やってみていただけませんか。(インデントはわざとしません。) --- while(<DATA>) { chomp; s/(.+?)$//; print "$_\n"; } __DATA__ 木立(こだち)のなかに(夏目弱石) 山の上の芋粥(いもがゆ)(芥川蛇の介) : 215 [sage] NGNG ん〜、なんないよ (5.005_03) 。 5.6 を試す環境が無いので申し訳ないでつが、Perl のバージョンの問題? : 名無しさん@お腹いっぱい。 [sage] NGNG 5.6.0 で試したらそのまま出ますた。 これまでの経緯をちゃんと読んでないんだが、 s/([^)]+)$//; じゃダメ? : 名無しさん@お腹いっぱい。 [sage] NGNG それだと、 [^)] の部分は [^\xa1\xcb] なのでダメだと思われ。 の方法だとうまくいくようになるの? : 名無しさん@お腹いっぱい。 [sage] NGNG 5.8.0だと、191の式でうまくいくんだがなぁ。 while(<DATA>) { chomp; s/([^()]+)$//; print "$_\n"; } __DATA__ 木立(こだち)のなかに(夏目弱石) 山の上の芋粥(いもがゆ)(芥川蛇の介) 木立(こだち)のなかに 山の上の芋粥(いもがゆ) : 189=207 [sage] NGNG 追試どうもです。 古いマシンに5.005_03(5.005_03 built for i386-linux)もあったのでやっ てみたら、奇妙なことに。 euc-jp-dos、shift_jis-unix → OK euc-jp-unix、shift_jis-dos → 行全体が出てくる v5.6.0 built for MSWin32-x86-multi-threadおよびv5.6.1 built for cygwin-multiでは、どれでもだめです(行全体が出てくる)。文字コードutf8 にしても同じ。 こりゃもう5.8にするべきですかね。 : 名無しさん@お腹いっぱい。 [sage] NGNG いやいや、たまたまうまくいっているように見えるだけでしょ。 さんのを参考にしる。 : 195 [sage] NGNG s/(.*?.)$//; にしとけ perlのバグだ 暇ならソースのMINMODあたり追いかけて : 189=207 [sage] NGNG ありがとん。「。」毎に改行入れようとして、s/(.+?。)//;やってみたが、こ れすらできんかった。結局、perl5.6以上はjperlないから日本語処理を中心に してる場合は、使えないってことかなぁ。もち、~ohzakiさんとこに書いてあ るような注意をしたり、半角文字で置き換えたりすれば使えるげど、面どい。 : 名無しさん@お腹いっぱい。 [sage] NGNG 5.8にしてEncodeつかう。 : 名無しさん@お腹いっぱい。 [sage] NGNG > 結局、perl5.6以上はjperlないから日本語処理を中心にしてる場合は、 > 使えないってことかなぁ。 違うっしょ。 : 189=207 [sage] NGNG やってみまつ。 じゃ、jperlでできるs/.+?[。!?]/$1\n/g;あたり、どやってやる? めんどいでしょ。 : 189=207 [sage] NGNG あら、s/.+?[。!?]/$&\n/g;だった。 : 名無しさん@お腹いっぱい。 [sage] NGNG あぁ、そういう話か。それはその通りですね。 でも、それは 5.8 の Encode とやらを使うと解決するってことなのでは。 っつーか、漏れは 5.8 動かせる環境無いので確認しようがないんでつが、 誰一人として Encode が一体何者なのか説明しようとしないのは何故? : 名無しさん@お腹いっぱい。 [sage] NGNG use utf-8; use Encode; my $ENC = 'euc-jp'; # or 'cp932' binmode STDOUT, ":encoding($ENC)"; binmode STDIN, ":encoding($ENC)"; 普通に標準入出力にアクセスすればOK。スクリプト内に日本語書くときはUTF-8で。 っていうかperldoc嫁 : 名無しさん@お腹いっぱい。 [] NGNG perl 5.6 では不可能ということか? : 189=207 [sage] NGNG まだ、5.8を試してないんですが、って、euc-jpの端末でeuc-jpのスクリ プト書いて、perlにutf-8で処理させるってことですね。utfサポートは、5.6 からあるので、mule-ucs+bdfフォントで、emacs上でprocess-coding-system (inputもoutputも)もutf-8にして、やってみたけどだめですた。 私が問題にしているのは、[](文字クラス)や+?、*?(最短一致)がマルチバ イトに対応しているかどうかということなのですが・・・ : 名無しさん@お腹いっぱい。 [sage] NGNG 5.6時代から既に対応している : 189=207 [sage] NGNG [](文字クラス)をテストしてみたけど、だめです。 utf-8で以下のスクリプト実行して見れ。jperlではOKですが・・・ --------- while(<DATA>) { chomp; while (s/.+?[。!?]//) { print "$&\n"; } print; } __DATA__ utf-8で処理させて下さいね。5.6でね。utfサポートは、 5.6からあるけど、このスクリプトだめぽ!は、何が 5.6時代から既に対応しているって言ってんの?変だよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG use utf8; してる? : 189=207 [sage] NGNG してなかったっす。 みなさん、ごめんなさ。 : 名無しさん@お腹いっぱい。 [sage] NGNG perl 質問スレにするなよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG というわけで、これにて終了。 正規表現スレはここまでです。 あれ? : 名無しさん@お腹いっぱい。 [sage] NGNG 単語に「マッチしない」のは どうやれば? ^\<word\> じゃないし。 : 名無しさん@お腹いっぱい。 [sage] NGNG そりを正規表現(だけ)で実現するのは難しいのでは? 普通は、grep なら -v とか、スクリプト言語なら !~ /word/ とかするんじゃないかと。 : 189=207 [sage] NGNG perlの拡張正規表現を使えば出来るよ。 /^(?!.*word)/ : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [sage] NGNG オ来リーの者じゃありませんが・・・ 『詳説 正規表現 第2版』 Jeffrey E. F. Friedl 著 田和 勝 訳 2003年5月発行 -- 5月27日発売 464ページ 本体価格5,400円 ISBN4-87311-130-7 テキストやデータの処理に欠かせない強力なツールとして瞬く間 に普及した「正規表現」。現在ではPerl、Java、VB.NETやC#など 数多くの言語やツールに標準で装備されています。その幅広い可 用性、柔軟性と比類ない強力さにもかかわらず、実際に正規表現 を使いこなすことは難しいです。本書は正規表現の概念を詳細に 掘り下げる一方で、数多くの言語やツールの実例を示しながら、 正規表現についての理解を深める解説書です。第2版では、豊富 な実例を使い、詳しくていねいに解説するスタイルはそのままに、 Perl5.8の新機能に加え、Javaと.NETの正規表現にもそれぞれ独 立した章を設けるなど、全編にわたって大幅に加筆がなされまし た。正規表現の本質を読み解く決定版です。とくに正規表現を使 いこなしていると自負している人にほど読んでほしい本です。 : 名無しさん@お腹いっぱい。 [sage] NGNG あれ?今日買ってきたんだけど27日発売だったのね… : 名無しさん@お腹いっぱい。 [age] NGNG つーことで発売記念age : 名無しさん@お腹いっぱい。 [sage] NGNG 素数にマッチする正規表現募集。 : 名無しさん@お腹いっぱい。 [sage] NGNG 第1版と比較してのレビューきぼんぬ : 名無しさん@お腹いっぱい。 [半額きぼんぬ sage] NGNG > 2003年5月発行 -- 5月27日発売 とあるからまだ無理なのでは : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現だけでなく、なんかしら言語使ってやればよい。 : 名無しさん@お腹いっぱい。 [sage] NGNG 何故敢えて茨の道を行くのか? : 名無しさん@お腹いっぱい。 [] NGNG これの第1版買ったのですが、いまいち難しかったです。 もっと易しい本ってないですか? : 名無しさん@お腹いっぱい。 [sage] NGNG Ruby の初・中級者なら、「Ruby Magic―Rubyで極める正規表現」はお勧め。 : 245 [sage] NGNG 第1版を持ってないので比較は出来ないっす。 # 買おうと思ったら第2版が出ることを知ったので待ったのだ。 ここに特徴や目次が紹介されているので見てもらうとして ttp://www.oreilly.co.jp/BOOK/regex2/ ttp://www.oreilly.co.jp/BOOK/regex2/contents.htm まえがきから第1版との違いを判断すると - Unicodeのちょっとした解説 - Perl5.003からPerl5.8対応に - Java1.4のjava.util.regexと、その他6つの正規表現パッケージの比較 - .NET framework正規表現の特徴と問題点、M$のドキュメント(貧弱らしい)の補足 のように言語サポートが新しくなった/増えたって感じ。 最初はHTMLのサンプルを少々追加する程度の予定(3ヶ月の見込み)だったみたいだけど、 結局は2年の歳月をかけて全面的に加筆修正することになったそうだ。 難易度は第1版と変わらないのではないかな? # 読み易くなってるのかもしれないけど。。 の期待には応えられないと思う。 > とくに正規表現を使いこなしていると自負している人にほど読んでほしい本です。 という宣伝文句があるくらいだしね。 いや、24日に買えたのよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 今日発売か。 昼休みに買ってくるか。 : 名無しさん@お腹いっぱい。 [sage] NGNG さん、どうですた? : 249 [sage] NGNG さんのと、今日立ち読みした感じで、第2版も購入することにしますた。 そういえば、翻訳者 (監訳者) が変わってたんですね。 : 名無しさん@お腹いっぱい。 [sage] NGNG sed のタグ付き正規表現についてちょっと教えれ。たとえば、 {________I'm_dreaming_of_a_White_Christmas_} {_Just_like_the_ones_I_used_to_know__} {____Where_the_tree_tops_glisten_} の前後の余計な _ のトリミングをしようと思って sed 's/{\(_*\)\(.*\)\(_*\)}/{\2}/g' とやっても意図した結果にならない。\2 をうまくマッチさせる方法は? まぁこの例なら簡単に逃げられる - たとえば sed 's/{_*/{/;s/_*}/}/' - わけだが、apache の log とかの簡単なパース(並び替えとかそんな程度)を タグ付き正規表現でさくっと処理できれば楽でうれしい。よろしく。 : 名無しさん@お腹いっぱい。 [sage] NGNG 二個目の*がlongest matchしようとして 3個目の*にmatchさせたいであろう_まで持っていってしまうのが原因。 sed -e 's/{_*\(.*[^_]\)_*}/\1/' : 名無しさん@お腹いっぱい。 [sage] NGNG '<,'>s@^@//@ : 名無しさん@お腹いっぱい。 [sage] NGNG 最少マッチって perl とか ruby にしかない? sed, grep 等の伝統的 tool にはないの? : 名無しさん@お腹いっぱい。 [sage] NGNG ないよ : 名無しさん@お腹いっぱい。 [] NGNG grepに最小一致の機能があったとして それの魅力はイッタイ何なのだろうか? : あぼーん [あぼーん] NGNG あぼーん : 262 [sage] NGNG 確かに sed では使っても grep では使わないかも。 いや、でも後方参照する時に必要なこともありえますね。 : 名無しさん@お腹いっぱい。 [sage] NGNG 昼休みにいきつけの書店にいったが売ってなかったんで。 帰りに別の書店で買った。 でもまだ読んでない… 通勤時間に読むっつーてもあれを毎日持ち歩くのは 重たいしなぁ。 : 名無しさん@お腹いっぱい。 [] NGNG 文字列中、丸括弧(全角、半角問わず)で閉じられた部分を取り出す表現を考えているけど、うまくマッチしてくれない。 (丸括弧の中に丸括弧は含まない。Perlの正規表現を使用) $string = '(22(1)'; if($string =~ /[((]([^()()]*)[))]/){ print $1; } else{ print "No match.."; } この場合は"1"がマッチするのを期待しているのだけど、なぜか"22"の部分がマッチした。 OS(UNIX/WinXP)、Perlのバージョン(5.0/5.8)の異なる環境で同じことを確認したけど、結果は変わらず。 さらに、文字コード(Shift-JIS/EUC)の違いでも、結果は変わらなかった。 "1"をマッチさせる別の表現はないですかね? # 全角"("の中にどうも半角")"の文字が隠れてるのかなぁ?(あくまでも推測) : 名無しさん@お腹いっぱい。 [sage] NGNG おめな、2byte文字と1byte文字が同じに扱われると思ってるらしいな。たぶん、 文系のドキュソだな。しかも、すぐ上で2byte文字コードの話出てたの見てね えな。こいう、初心者質問は、webprogのPerl初心者スレ逝け。 : 名無しさん@お腹いっぱい。 [sage] NGNG Perl5.8.0 + UTF8 でやったら 1 になったよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG [ ] のなかに '-' と ']' の両方を入れたい場合はどうすればいいのですか? : 名無しさん@お腹いっぱい。 [sage] NGNG 何で? : 名無しさん@お腹いっぱい。 [sage] NGNG []-] : 名無しさん@お腹いっぱい。 [sage] NGNG !.-[ : 名無しさん@お腹いっぱい。 [sage] NGNG 保守 : 名無しさん@お腹いっぱい。 [sage] NGNG regexp ml盛り上がってますね。読んでて楽しい。 : 名無しさん@お腹いっぱい。 [sage] NGNG このスレはいつからまともな人たちをヲチするようになったのですか? : 名無しさん@お腹いっぱい。 [sage] NGNG すいません、テキストファイルの中の .bananaなどの単語(行頭ではなく)の先頭が ドットがあるものだけをgrepで抜き出したいのですが、jp.appleのような単語までひっかかって しまい上手く絞り込めません。 アドバイスをお願いします!! : 名無しさん@お腹いっぱい。 [sage] NGNG \b?\.\w+? で、どうじゃろ? : 名無しさん@お腹いっぱい。 [sage] NGNG すいません、なんか上手くいかないです。 ls -laでディレクトリ内の全ファイルを表示して、grepで隠しファイルだけを抽出したかったのですが。 : 名無しさん@お腹いっぱい。 [sage] NGNG ls -la | grep ' \.' ではあかんの? : 名無しさん@お腹いっぱい。 [sage] NGNG 行のどこかに"."があれるとヒットしてしまうんです : 名無しさん@お腹いっぱい。 [sage] NGNG ls -la | grep '^\.' こういうこと? : 名無しさん@お腹いっぱい。 [sage] NGNG とはいえ、"."って、ファイル名にしかでてこないよね? をよーくみる。 : 283 [sage] NGNG 間違えた。 ls -1a | grep '^\.' これか ls -la | grep ' \.' これだな。下は余計なものを拾う可能性もあるが。 : 名無しさん@お腹いっぱい。 [sage] NGNG ls -d .* なんてね。 : 名無しさん@お腹いっぱい。 [sage] NGNG あ、正規表現スレだった。すまん。 : 名無しさん@お腹いっぱい。 [sage] NGNG ヤハリココハオモッテタトオリバカバッカリダッタナ(プ : 名無しさん@お腹いっぱい。 [sage] NGNG ls -la | awk '$9 ~ /^\./{print $0}' はどうよ。 : 名無しさん@お腹いっぱい。 [] NGNG >>280 ふつーそういうときは ls つかわず findつかえ。 find ./ -type f -name "\.*" -print : 名無しさん@お腹いっぱい。 [sage] NGNG (()) : 名無しさん@お腹いっぱい。 [sage] NGNG ふつーそういうときは >> つかわず >> つかえ。 : 名無しさん@お腹いっぱい。 [sage] NGNG backreferenceを前方参照と訳したのはなぜですか? : 名無しさん@お腹いっぱい。 [sage] NGNG 後方参照としている訳もあるよ。 まぁ、現在の位置よりも前を参照するという意味では 日本語的には前方参照であってると思う。 ようするに「今いる位置より戻って参照」って意味になるんだから。 んでも、意味を考えて訳すなら「戻って参照」とか、どう? : 名無しさん@お腹いっぱい。 [sage] NGNG ちょっと前にCスレで話題になったんだけど、Cで「前方参照」といった場合の前方って、 ファイルの終端方向を指す。「ひどい訳語だ」ってことで話は終わったんだけど、 正規表現でも混乱が見られるしなんかいい言葉ないもんかねえ。 日本語では時間を表す文脈で「前」にまるで正反対の意味があるからよくないのだと思う。 「以前」だと過去だし「前進」だと未来だし。 あとこれはすれ違いか? そうだよね。すまん。 : 名無しさん@お腹いっぱい。 [sage] NGNG みなさま、ありがとうございます。 シングルクォーテーションに空白が使えたり、 アッパーチルダとハット(キャレット?)の区別を知ったりと、 正規表現の難しさを知りました。 今、「テキストデータ料理学」っていう古い本を読んでいるのですが、 オライリーの正規表現本は買ったほうがいいですか? (もう2〜3週間前にオライリーのサイトでカタログを注文したのに、 まだ来ない…) : 名無しさん@お腹いっぱい。 [sage] NGNG おれは初版も新しいのも持ってるけど、自分の知識に自信がないうちは お薦めしない。もちろんあったらあったで便利だけど。 やっぱり、「俺、正規表現バリバリだぜーYAH」状態で買って読んで 目からうろこ落ちまくり感を堪能するのがいいんではないかと。 : 名無しさん@お腹いっぱい。 [] NGNG >294 するってえと、正規表現的には日本語で前方参照あるいは後方参照と書いてあったら どっちもbackreferenceと思えってわけだぁね。 >295 計算機分野だと「前方」という言葉はforwardの訳語というのがあたりめえだと思ってたから、 正規表現関係だと、「前方参照」がbackreferenceのことだっていうのがわかんなくて 難儀したってわけよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG は学ぶ意欲を持っているから、今のうちに買っておいて損はないと思う。 むしろ薦める。 オイラリーはハズレが少ないからな。 : 名無しさん@お腹いっぱい。 [sage] NGNG 俺はperlから入ったから後方参照が当たり前かと思ってた。 他言語使うようになってから吃驚したってわけよ。 : 298 [sage] NGNG perl5の日本語マニュアルで、「前方参照」を "lookahead assertion"の訳語として 使っているやつがあった。 (?=regexp) 長さの無い、前方参照位置指定子。 (?!regexp) 長さの無い、前方参照否定位置指定子。 英語だと (?=pattern) A zero-width positive lookahead assertion. (?!pattern) A zero-width negative lookahead assertion. わけわかんねぇな(w : 298 [sage] NGNG ありゃりゃ? (?<=pattern) A zero-width positive lookbehind assertion. (?<!pattern) A zero-width negative lookbehind assertion. "lookbehind assertion" の訳語って何だ? : 名無しさん@お腹いっぱい。 [sage] NGNG 「俺の背後に立つな」 デューク東郷の格言だろ。 : 名無しさん@お腹いっぱい。 [sage] NGNG lookahead 見越し lookbehind 見返り : 名無しさん@お腹いっぱい。 [sage] NGNG 前後不覚だな。 : 名無しさん@お腹いっぱい。 [sage] NGNG >オライリーの正規表現本は買ったほうがいいですか? 持ってなくても覚えられるし、 エディタのサーチとか grep とかで実験しながら 感覚的に慣れるのも悪くないんじゃない? ただし emacs で覚え始めるのはすすめない。 backslash で混乱する。 : 名無しさん@お腹いっぱい。 [sage] NGNG ちょっと大きな本屋に行って立ち読みしてみます。 ありがとうございました〜 : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [age] NGNG 二度と目を覚ますな。 : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [sage] NGNG さげ保守 : 名無しさん@お腹いっぱい。 [sage] NGNG OOはもうすぐ1.1出るけど、MSWORDよりセキュリティ大丈夫かな? ttp://pc2.2ch.net/test/read.cgi/bsoft/1055292975/392 : あぼーん [あぼーん] NGNG あぼーん : 高校生 [] NGNG boo baa baz っていうテキストが例だとして、sedを用いて、 booまたはbaz、っていう正規表現はどうなるの? rubyやperlならパイプ記号で条件和の表現が出るけど、 同じように書いてもsedに誤解されてしまう。 : 名無しさん@お腹いっぱい。 [sage] NGNG ん? \|使えば良いのでは : 高校生 [sage] NGNG sed 's/boo\|baa/hoge/g' ./hage.txt とかだとやっぱりだめなんすよね。 「boo」とかの単語の括り方がよくわからんのです。 : 名無しさん@お腹いっぱい。 [sage] NGNG GNU sed 4.0.7版 ではそれでもできてるけどな。 sed 's/\(boo\|baa\)/hoge/g' これでどう? : 名無しさん@お腹いっぱい。 [sage] NGNG gsedならできるがsedは食ってくれない。 : 名無しさん@お腹いっぱい。 [sage] NGNG 単一の正規表現じゃなきゃいかんの? sedと決まってるなら sed -e 's/boo/hoge/g' -e 's/baa/hoge/g' でいいんちゃう? 置換後の文字列と置換前の文字列の片方とで重なりがある場合 どうするかひとしきりモメたりする ↓↓↓ のがお決まりだな。 : 名無しさん@お腹いっぱい。 [sage] NGNG 単一の正規表現でないと記述が冗長で見た目がキモイ、 っていうのはあると思うよ。 おいらはインストール直後のFreeBSDの環境構築をスクリプトに任せたくて、 結局シェルスクリプトにawkな記述を書いて解決した。 カーネルの再構築にしても、/etc/下の記述にしても、要はテキストの置換なわけで。 本当はrubyがFreeBSDの/usr/bin下にあるようなご時世だったら 楽ができるんだけど、そこら辺は個人的な勉強不足だなぁ。 : 名無しさん@お腹いっぱい。 [] NGNG {a,b}上の言語Lが 『aaで開始し、かつ、bbを部分列として含む』という条件を満たす語からなるとき Lを表す正規表現ってどうなるの? L=aa(a*b*+bb)* ? : 名無しさん@お腹いっぱい。 [sage] NGNG L=aa(a+b)*bb(a+b)* : 名無しさん@お腹いっぱい。 [sage] NGNG *+ ??? : 名無しさん@お腹いっぱい。 [sage] NGNG >323 '+'より'|'のほうが普通かな。 L=aa(a|b)*bb(a|b)* 本来的には連接、選択、閉包が表現できればいい。 : 名無しさん@お腹いっぱい。 [sage] NGNG L ::= aA A ::= aB B ::= aB | bC C ::= aB | bD D ::= ε | aD | bD : 名無しさん@お腹いっぱい。 [sage] NGNG .* 何にでもマッチする最強の正規表現です! : 名無しさん@お腹いっぱい。 [] NGNG ドットが含まれてなかったらマッチしない罠 : 名無しさん@お腹いっぱい。 [sage] NGNG キター : 名無しさん@お腹いっぱい。 [sage] NGNG ageてるし、ネタと見た。 : 名無しさん@お腹いっぱい。 [sage] NGNG しね! : あぼーん [あぼーん] NGNG あぼーん : あぼーん [あぼーん] NGNG あぼーん : 名無しさん@お腹いっぱい。 [] NGNG うまづら。 : 名無しさん@お腹いっぱい。 [sage] NGNG ほす。 : 名無しさん@お腹いっぱい。 [sage] NGNG ☆湯 : 名無しさん@お腹いっぱい。 [sage] NGNG [ruby-list:38393] じゃないけど、[a-z] みたいな文字クラスの表現は、 EBCDIC とかだと「意図した通り」には動かないと思うんだけど、 ASCII か ASCII を包含したキャラクタセットという前提で書くべきものなの? : 名無しさん@お腹いっぱい。 [sage] NGNG [:lower:] とかは使っちゃだめ? : 名無しさん@お腹いっぱい。 [sage] NGNG あ、いや、質問が悪かったですね。 範囲指定する文字クラスはどうあるべき (書くべき) か?っていう話です。 ていうか、 re_format(7) を私の拙い英語力で読んでみたところ、 ASCII コードの並びを前提とするような文字クラスの範囲指定は、 portable じゃないからやらない方が良い、ということのようですね。 というわけで、極力 さんのみたいな文字クラス指定を使った方が良い、と。 : 名無しさん@お腹いっぱい。 [sage] NGNG ★ : 名無しさん@お腹いっぱい。 [sage] NGNG 保守 : 名無しさん@お腹いっぱい。 [] NGNG vimで"DEL"という文字列が含む行で、"DEL"以下を削除したい場合はどうしたらいいでしょうか? : 名無しさん@お腹いっぱい。 [sage :s/DEL.*$/] NGNG スレ違い。 Vim6 Part6 ttp://pc.2ch.net/test/read.cgi/unix/1058706125/ : 名無しさん@お腹いっぱい。 [] NGNG :%s/DEL.*// : 名無しさん@お腹いっぱい。 [sage] NGNG サンクス、すみません。 : 名無しさん@お腹いっぱい。 [sage] NGNG ☆ : 名無しさん@お腹いっぱい。 [] NGNG DELは残したい場合はどうすればいいですか? : 名無しさん@お腹いっぱい。 [sage] NGNG :%s/DEL.*/DEL/ : 名無しさん@お腹いっぱい。 [] NGNG MS-DOSが使われていた頃に、"mifes"と言うエディターが有った。 そのマニュアルに1頁ほどの正規表現の説明があって、自分は最初に、それで 覚えて使い出した。 使い始めの頃は、何回も間違えたけど、少しづつ慣れてきた。 自分の周りを見ても、プログラマを何年もやっていても正規表現を知らない 人は、結構いる。 一旦、覚えてしまうと非常に便利だと思うんだけど。 : 名無しさん@お腹いっぱい。 [] NGNG 正規表現で俺の存在を抹消してくれ。 : 名無しさん@お腹いっぱい。 [sage] NGNG s/俺の存在//g; : 名無しさん@お腹いっぱい。 [sage] NGNG gsub!(/俺の存在/, "") : 名無しさん@お腹いっぱい。 [sage] NGNG 捕手 : 名無しさん@お腹いっぱい。 [sage] NGNG rー、 」´ ̄`lー) \ T¨L |_/⌒/ `レ ̄`ヽ〈 | i__1 _ゝ_/ ノ L__jイ´_ ) | イ | ノ--、 r'⌒ヽ_ ゝ、___ノ二7 /´ ̄l、_,/}:\ |ーi | l_/ /__ィ::. ゝ~_ィ´:; ,ゝ __〉 { (T´ |1:::. \_>、};;_」 'ー‐┘ ! ` ̄''ァ一 、\ ヽ} ← 保守 〈` ̄ ̄^`¬ノ .::〔 ̄´ 1 ヽ .:::レ ヽ、 |_イー-、_;;j|_:. ゝ、 __,,,... -- |. {―――‐フゝ、 〉 -- ...,,,__ _,, -‐ ´ ,r|__ト, 1ニノ ー'´ ` ‐- ,,_ , ‐ ´ └―'´ ` : 名無しさん@お腹いっぱい。 [sage] NGNG それ捕手じゃなくて投手やっ!www : 名無しさん@お腹いっぱい。 [sage] NGNG 別のスレからの引用 ps ax |grep '[s]shd' とやると、grep自身の行にヒットしないそうだけど、なぜ? sってメタ文字でもなんでもないのに。 : 名無しさん@お腹いっぱい。 [sage] NGNG なぜって言われても、自明だが。 : 名無しさん@お腹いっぱい。 [sage] NGNG grep sshd と何が違うの? : 名無しさん@お腹いっぱい。 [sage] NGNG あ、ごめん、わかった(w : 名無しさん@お腹いっぱい。 [sage] NGNG grep sshd だと、ps の出力に含まれる "grep sshd" の "sshd" がマッチする。 grep '[s]shd' だと、ps の出力には "grep [s]shd" が含まれるが、 この "[s]shd" は、[s]shd にはマッチしない。よね?わかる? : 名無しさん@お腹いっぱい。 [sage] NGNG なるほど。トリックだな。 : 名無しさん@お腹いっぱい。 [sage] NGNG まあバッドノウハウだとも思うけどナー ttp://www.namazu.org/~satoru/misc/bad-knowhow.html : 名無しさん@お腹いっぱい。 [sage] NGNG そこまでのものではないと思うけど、 この例だと、頭の中でpsの出力まで加工しちゃうからな(w : 名無しさん@お腹いっぱい。 [sage] NGNG grep -v grep でええやん。 : 名無しさん@お腹いっぱい。 [sage] NGNG muttのaliasで alias keyword Name <mailaddress> みたいなフォーマットで並んでいるファイルを alias keyword <mailaddress> # Name に整形しようと思い, cat alias | sed 's![[:space:]]*alias[[:space:]]*\([^[:space:]]*\)[[:space:]]*\(.*\)[[:space:]]*<\(.*\)>!alias \1 <\3> # \2!' > alias.new としました. 上手く行くんですが, "#" の位置が行ごとにバラバラなのが気持ち悪いです. そのファイルで "#" 以前の文字数が一番長いものを調べ, そこに合わせて その他の行の "#" 以降を持ってくるようにするにはどうすればいいんでしょうか? : 名無しさん@お腹いっぱい。 [sage] NGNG sedでやれってか? 漏れはへたれなので、Perlなどを使ってしまうが(w : 名無しさん@お腹いっぱい。 [sage] NGNG 2パスでやれば? : 名無しさん@お腹いっぱい。 [sage] NGNG 2パス? : 名無しさん@お腹いっぱい。 [sage] NGNG "#" 以前が一番長いのを調べてから、それに合わせて整形し直せば。 : 名無しさん@お腹いっぱい。 [sage] NGNG 70桁でそろえる場合 sed ':a /.\{70\}\#/!bc; b; :c s/\(.*\)\#\(.*\)$/\1 \#\2/; ta' 亀ですが、こんなんでどうでしょう : 名無しさん@お腹いっぱい。 [sage] NGNG 決め打ちでいいなら何の苦労もないわけで。 : 名無しさん@お腹いっぱい。 [sage] NGNG 反則技。gawk で。sed ではどうやっても出来ないような気が……(_ _;) # sed でできるのか? { a=index($0,"#"); if(a>best) { best=a; } c[FNR]=$0 } END { for(i=0;i<=NR;i++){ x=index(c[i],"#"); if(x && x<best) { for (j=x;j<best;j++) { gsub("#"," #",c[i]); } } print c[i] } } : 名無しさん@お腹いっぱい。 [sage] NGNG ( ´∀`) : 名無しさん@お腹いっぱい。 [sage] NGNG 保守 : 名無しさん@お腹いっぱい。 [] NGNG 教えてください。 Windows用のファイルをemacsなんかで開いたとき,最下行に ^Z という符号が表示されることがあります。 これはいったい何でしょうか? : 名無しさん@お腹いっぱい。 [sage] NGNG いわゆるeof : 名無しさん@お腹いっぱい。 [sage] NGNG ありがとうございます。この符号のあるファイル同士をcatで連結すると,途 中にこの符号が入ってしまいます。この符号をsedでマッチさせて消去したい のですが,どうすればいいでしょうか。 sed '/^$/d' ではダメでした。 : 名無しさん@お腹いっぱい。 [sage] NGNG いわゆるeof : 名無しさん@お腹いっぱい。 [] NGNG EOF符号をsedで消去できますか? : 名無しさん@お腹いっぱい。 [sage] NGNG grep で使える正規表現を精密に解説したサイトはありますかね? 日本語/英語どっちでもいいのですが。 : 名無しさん@お腹いっぱい。 [sage] NGNG ttp://www.kt.rim.or.jp/~kbk/regex/regex.html : 名無しさん@お腹いっぱい。 [sage] NGNG レベル低いなー 378に対して出来るとも出来ないとも言えないのか... : 名無しさん@お腹いっぱい。 [sage] NGNG 378=381 ですか? : 名無しさん@お腹いっぱい。 [sage] NGNG できるよ。普通に s/^Z// とかすればいい。もちろん^ZはEOFの一文字ね。 こんなの試せばすぐわかるだろと思ってたんだが、よくを読むと、 「正規表現は純なテキストであるべきで特殊記号を混ぜるのはイクナイ」 と感じたんだろうな。まあ気持ちはわかるわ。 最近の正規表現拡張では、文字をコードの数値で表現する文法が 入ってたりする方が普通(例えばperlとか)だもんな。 : 338 [sage] NGNG でね、特殊記号の特別なケースがtab。大昔は\tなんて表現なかったさ。 よく画面上の見た目やハードコピーや雑誌からシェルスクリプトを打ち直して、 tabとspaceの違いで動かないなんてことが時々あったんだよ。 あと勝手にシェルスクリプトを整形されて動かなくなるとか。 : 名無しさん@お腹いっぱい。 [sage] NGNG いいえ ありがトン! : 名無しさん@お腹いっぱい。 [sage] NGNG 381=385 が正解 : 名無しさん@お腹いっぱい。 [sage] NGNG ブックマークにいれますた。 : 名無しさん@お腹いっぱい。 [] NGNG [\\w$'-] これはどういうことなのでしょう? [\w$'-] ならわかるのですが.. : 名無しさん@お腹いっぱい。 [sage] NGNG 処理系は何? : 名無しさん@お腹いっぱい。 [] NGNG Rubyです Regexp::compile("\b\d[\d\.]+\d\b|[\w]+|[\\w$'-]+") scanメソッドで英文を分割してます : 名無しさん@お腹いっぱい。 [sage] NGNG ほほう。バグってる悪寒。 : 名無しさん@お腹いっぱい。 [sage] NGNG Regexp::compile("\\b\\d[\\d\\.,]+\\d\\b") こんなのがあるんですが.. : 名無しさん@お腹いっぱい。 [sage] NGNG Ruby で "..." の中で '\' を書くときは、'\' でエスケープする必要があるの。 つまり Regexp::compile("\\w") は /\w/ と同じ。 のだと '\' のエスケープが足りない部分があるように見える。 たとえば、 "\w" は "w" に、 "\b" は "\010" になっちゃう。 ので「バグってる悪寒」と言いました。 : 名無しさん@お腹いっぱい。 [sage] NGNG なるほど、必死に\\と重ねる正規表現について調べてましたよ ありがとう : 名無しさん@お腹いっぱい。 [sage] NGNG perl で質問です。 NOTE note "note" notes 上のような文字列を「book」だけを「note」に置換したいのですが s/\bnote\b/book/g のようにすると、ダブルクォートで囲まれているものも置換されてしまうのですが それを NOTE book "note" notes のようにするにはどう表記すればよいのでしょうか? 詳しい方、教えてください。 : 名無しさん@お腹いっぱい。 [sage] NGNG > NOTE note "note" notes > > 上のような文字列を「book」だけを「note」に置換したいのですが : 名無しさん@お腹いっぱい。 [sage] NGNG その下の s/\bnote\b/book/g ぐらい読んで多目にみてやれ。 とはいえ、仕様があいまいすぎ。 'note' はどうする? :note: は? "abc note def" は? : 名無しさん@お腹いっぱい。 [sage] NGNG s/ note / book /g か? > とはいえ、仕様があいまいすぎ。 んだな。 : 名無しさん@お腹いっぱい。 [sage] NGNG s/(?=[^"])\bnote\b(?=[^"])/book/g; # こんなんで良いわけないよなと思いつつ・・・ : 名無しさん@お腹いっぱい。 [sage] NGNG > とはいえ、仕様があいまいすぎ。 すいません、おっしゃるとおりです。 ある単語(note)をある単語(book)に置換したいのですが、 ダブルクォートで囲まれているもの("note")は、その置換からは除外したいのです。 > 'note' はどうする? :note: は? "abc note def" は? したがいまして、これらはとりあえず想定外で構わないので置換してしまっても構いません。 もう少し昨日の例を詳しく書きますと NOTE,note"note"notes-note このようなものでも NOTE,book"note"notes-book のようになってくれるのを期待しています。 ただ、"abc note def" これも想定外で構わないのですが 対応が可能であるのなら、私の勉強の為に教えてくださるとありがたく思います。 ありがとうございます。 >s/(?=[^"])\bnote\b(?=[^"])/book/g; これを試してみました。 基本的にOKかなと思ったのですが、行頭、行末では置換の対象となってくれませんでした。 : 名無しさん@お腹いっぱい。 [sage] NGNG 補足です。 ここでいう単語とは \w+ で表せる範囲のもので、 アルファベット大文字、小文字も含めて完全に単語の 先頭から末尾までが一致するものです。 : 名無しさん@お腹いっぱい。 [sage] NGNG もっと簡単にできるかもしれないけど、 s/(^|(?<=[^\w"]))note\b|\bnote($|(?=[^\w"]))/book/g; とかは? > ただ、"abc note def" これも想定外で構わないのですが 後ろから数えた"の個数が奇数ならマッチしないようにして、 $b =~ s/\bnote\b(?=([^"]*"[^"]*")*[^"]*$)/book/g; とすれば、"のマッチングが保証できる範囲ではなんとかなるかも。 前からの"の個数でマッチさせようとしたら、 可変長のlook-behindは実装してないらしい。(perl 5.8) : 名無しさん@お腹いっぱい。 [sage] NGNG s/"note"/hogehoge/g s/note/book/g s/hogehoge/"note"/g おれならこうしちゃうな。 考えんのめんどい。 : 名無しさん@お腹いっぱい。 [sage] NGNG ありがとうございました。 たいへん勉強になりました。 : 名無しさん@お腹いっぱい。 [] NGNG 質問させてください。 &にはマッチして欲しいのですが、&にはマッチして欲しくないのです。 どのように記述すればよいのでしょう。 お願いします。 : 405 [] NGNG &にはマッチ &amp;にはマッチしない でした。すいません。 : 名無しさん@お腹いっぱい。 [sage] NGNG Perl5 でいい? : 名無しさん@お腹いっぱい。 [sage] NGNG /&(?!amp;)/ : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現のおすすめ書って何がありますか? : 名無しさん@お腹いっぱい。 [sage] NGNG オライリーのやつ。 : 名無しさん@そうだ選挙に行こう [] NGNG ワイルドカード(DOS)の *.txt って、正規表現だとどう書くの? : 名無しさん@お腹いっぱい。 [sage] NGNG {(([0-9a-zA-Z]){0,})\.txt}とか半端に返してみるテスト : 名無しさん@お腹いっぱい。 [sage] NGNG [^\\/]+\.[Tt][Xx][Tx]\z とか (ry : 名無しさん@お腹いっぱい。 [sage] NGNG foo と bar 両方含む行をマッチさせたいんだけど、 awkでいうところの and演算子 % awk /foo/&&/bar/ が使える、windowsで動くgrepツールなんか教えてください。 #絞込み再検索のないGUIなgrepツールなんかイラネ : 名無しさん@お腹いっぱい。 [] NGNG ,413 . 記号は \ でエスケープになるのですね。.*\.txt でマッチはしました。 助かりました、ありがとうです。 : 名無しさん@お腹いっぱい。 [sage] NGNG FIND "foo" | FIND "bar" みたいのじゃ駄目? : 名無しさん@お腹いっぱい。 [sage] NGNG |が使えるツールなら、/foo.*bar|bar.*foo/とかで近似できるんじゃないの。 CygwinのGNU grepで試してみた。 > cat foobar.txt foo bar foo foo foo bar bar bar bar foo > grep -n "foo.*bar\|bar.*foo" foobar.txt 4:foo bar 6:bar foo > : 414 [sage] NGNG なるほど、andをorに展開すればいいのか。 しかし fooかつbarかつbazを検索、つーばあい展開すんのめんどくさいなぁ。 windowsのGUIなgrepツールは、サブフォルダも検索、とかできて 結構便利なのも歩けど、パイプとかorが使えなかったりしてイマイチ。 結局cygwinでawk使ってるけど、これもいまひとつメンドクサイ。 2chのログを検索してるだけなんだが_| ̄|○ : 名無しさん@お腹いっぱい。 [sage] NGNG xyzzy の ggrep 辺りがいいんじゃない? : 名無しさん@お腹いっぱい。 [] NGNG Windows の AWKじゃだめですか? : 名無しさん@お腹いっぱい。 [] NGNG Perloしかないべ : 名無しさん@お腹いっぱい。 [] NGNG #から行末までをあらわす正規表現ってどうやればいいんでしょうか。 : 名無しさん@お腹いっぱい。 [sage] NGNG #.*$ : 名無しさん@お腹いっぱい。 [sage] NGNG #[^#]*$ : 名無しさん@お腹いっぱい。 [sage] NGNG 質問があります。 サクラエディタ(正規表現ライブラリ:BREGEXP.DLL)でCソース中のhogehogeをgrepしてた 場合に、コメント化(//)されている行だけは検索結果に表示したくないんですが、 どのような正規表現で検索すればいいでしょうか? : 名無しさん@お腹いっぱい。 [] NGNG あげ : 名無しさん@お腹いっぱい。 [sage] NGNG そのエディタよく知らないんだけど、Unix で動くの? : 名無しさん@お腹いっぱい。 [sage] NGNG スレタイだけ見て、板を確認してないんだと思われ。 : 名無しさん@お腹いっぱい。 [sage] NGNG それを言うと、このスレ自体板違いな気もしなくはないが。ム板のだけで十分やん。 : 425 [] NGNG UNIX板って知っていて質問をしましたが。 とりあえず、ム板に逝ってみます。 : 名無しさん@お腹いっぱい。 [sage] NGNG Unix 用のソフトなの? : 名無しさん@お腹いっぱい。 [sage] NGNG is not UNIX : 名無しさん@お腹いっぱい。 [] NGNG 多分エディタの種類はどうでもよくて、 /\/\*.*\*\/ とか、そんな答えを期待していたと思われ : 名無しさん@お腹いっぱい。 [sage] NGNG ム板の正規表現もとんと書き込みないから、テストしてみたら 書き込めた。ここもどうなんだか、書き込んでみる。 : 名無しさん@お腹いっぱい。 [sage] NGNG ハハ*.*ハハ : 名無しさん@お腹いっぱい。 [] NGNG 指定文字列A 何か 指定文字列B という何かにヒットさせるにはどういう正規表現にすればいいですか? : 名無しさん@お腹いっぱい。 [sage] NGNG 素で答えると「文字列A.*文字列B」だけど?そういう話? もちろん文字列ABに特殊記号があったらどうするかとか、 .*は最長マッチでいいのとか、いろいろ細かい話はあるけど。 : 436 [] NGNG 自分で、 (文字列A).*{2,15}(文字列B) とかでやってみたんですが、 マッチするのが、 指定文字列A 何か 指定文字列B がマッチしてしまうので… 何か の部分だけを抽出しようと思ってます。 : 名無しさん@お腹いっぱい。 [sage] NGNG 後から取り出したい部分を()で囲む。(.*{2,15})みたいに。 : 436 [] NGNG さんの方法でも結果が変わりませんでした… 処理系が違うからかな? とりあえず諦めて、 指定文字列A 何か 指定文字列B をマッチさせて、指定文字列A+1文字目から 何か の文字数だけ切り取ることにします。 ありがとうございました。 : 名無しさん@お腹いっぱい。 [sage] NGNG で、その処理系が何かを晒すつもりは毛頭無いわけですね? : 名無しさん@お腹いっぱい。 [sage] NGNG ハゲには無理 : 436 [sage] NGNG 何度もすいません。 C#です… 改めてやってみるとさんの方法でいけました。 group[1]に入ってたんですね。全体しか見てませんでした。 板違いにお騒がせしました。 : 名無しさん@お腹いっぱい。 [] NGNG Perlの場合、 $_ = "いっぱい"; s/い/お/; # おっぱい s/い/お/g; # おっぱお ということでおk? : 名無しさん@お腹いっぱい。 [sage] NGNG _ ∩ ( ゚∀゚)彡 おっぱい!おっぱお! ⊂彡 : 名無しさん@お腹いっぱい。 [sage] NGNG 小学生のころ流行ったネタ : 名無しさん@お腹いっぱい。 [sage] NGNG 性器表現 : 名無しさん@お腹いっぱい。 [sage] NGNG ワロテモータ : 名無しさん@お腹いっぱい。 [sage] NGNG さんざん概出なのに・・・ : [sage] NGNG : 名無しさん@お腹いっぱい。 [sage] NGNG .* : ウサチャソ [sage bill@microsoft.com] NGNG ↑アナルは性器じゃねーよな、とか思ってよく見ると、ドット米。 イボ痔か? : 名無しさん@お腹いっぱい。 [sage] NGNG 拭き忘れたウンチだよ。きっと! : 名無しさん@お腹いっぱい。 [] NGNG regexp : 名無しさん@お腹いっぱい。 [sage] NGNG rege*p : 名無しさん@お腹いっぱい。 [sage] NGNG 正規表現で複数の単語の中に「/」があるときにヒットさせたいんですが echo "hoge / hoge" | grep "\</\>" でだめでした・・。だれか修正をお願いしますorz : 名無しさん@お腹いっぱい。 [sage] NGNG 条件をもっと明確に定義しろ。 マルチすんな。 : 456 [sage] NGNG 複数の単語の中で、"/"のみで構成される単語が存在する場合のみ ヒットさせたいのです つまり a b c / d 上記ようなときで下記のどの事象にもヒットさせたくはないのです // /a a/ a/a : 名無しさん@お腹いっぱい。 [sage] NGNG ttp://pc5.2ch.net/test/read.cgi/linux/1101654885/957 とこっちと、どっちで続けるのかね。 : 名無しさん@お腹いっぱい。 [sage] NGNG まことに勝手ながらこちらで続けさせてください 質問を改めます やりたいことは ----------------------- 1) echo "/" | grep ...... 2) echo "/ a b" | grep ...... 3) echo "a b /" | grep ...... 4) echo "/a / b/" | grep ...... ----------------------- 上ですべてマッチさせて 以下はすべてはじくようにしたいのです ----------------------- 5) echo "//" | grep ...... 6) echo "// /// ////" | grep ...... 7) echo "/a b/ /c/" | grep ...... ----------------------- 上と下の違いは、前後にスペースを含む" / "が存在するか否かです よって以下のように考えましたが、ヒットしませんでした echo "a / b"|grep "\</\>" echo "a / b"|grep "\<\/\>" どなたか修正をおねがいしますorz : 名無しさん@お腹いっぱい。 [sage] NGNG grep と言ってもいろいろあるんだが どの OS のどの grep よ。 : 456 [sage] NGNG ↑修正します 修正前)上と下の違いは、前後にスペースを含む" / "が存在するか否かです 修正後)上と下の違いは、単語 / が存在するか否かです : 名無しさん@お腹いっぱい。 [sage] NGNG > 上と下の違いは、前後にスペースを含む" / "が存在するか否かです 1) と 2) には存在しないようだが。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「単語」とは? : 名無しさん@お腹いっぱい。 [] NGNG ブラケットの中でピリオドを入れる時ってメタキャラクタとして扱われますか? [\w.] と [\w\.] が同じ動きにになるみたいなんですけど・・・。 ちなみに、パールです。 : 名無しさん@お腹いっぱい。 [sage] NGNG 「みたい」じゃなくてテストコードで示してよ。 : 名無しさん@お腹いっぱい。 [sage] NGNG どの言語の正規表現がどんな有限オートマトン使ってるという情報って どこかにありますかねぇ。正規表現コンバータ作ろうかと思ってるのですが。。 NFA、DFAの違いぐらいは詳説正規表現の本でわかるのですが、実装ともなると。 オートマトンの変換に関してはコンパイラの本を参考にしてますが、 やはりかなりつらいものがありますね。たんに字句解析して作った方がいいのかなぁ。 : 名無しさん@お腹いっぱい。 [sage] NGNG 普通にNFA+DFAでいいじゃん : 名無しさん@お腹いっぱい。 [sage] NGNG オブジェクト指向正規表現の仕様策定はまだですか? : 名無しさん@お腹いっぱい。 [sage] NGNG 聞いたことないな。 何それ? : 名無しさん@お腹いっぱい。 [sage] NGNG まかせた。 : 名無しさん@お腹いっぱい。 [] NGNG お前らWinの.NETなんだが正規表現の質問をさせてくれ。 RegularExpressions.Regexで下の文字列を検索して<TD>から</TD>に分けたい。 string strHtml = "<TD>a</TD><TD>b</TD><TD>c</TD>" Regex regex = Regex("<TD>.*</TD>"); MatchCollection matchcollection = regex.Matches(strHtml); だと最長一致で "<TD>a</TD><TD>b</TD><TD>c</TD>"の1つのコレクション取得。 Regex regex = Regex("<TD>.*?</TD>"); だとやりたい "<TD>a</TD>", "<TD>b</TD>","<TD>c</TD>"の3つのコレクションが取得できる。 .*? の意味をアフォにも分かるように説明してくれ。 .*(任意の0文字以上)が?(あるかないか)だろ。 なんで思った通りに3つのコレクションが取得できるの? : 472 [] NGNG *? つーのは最短一致という便利なキーワードなのか。 つまらん質問失礼しますた。 : 名無しさん@お腹いっぱい。 [] NGNG 下がってるので、どれ一つ、とんちでも。 rubyでは /aa+??/ =~ "a" => 0 emacsでは "aa+??" =~ "a" => nil さて、こうなってしまうのは、各々がどのようなオートマトンで 解釈されているからでしょうか。 : 名無しさん@お腹いっぱい。 [sage] NGNG emacsって最短マッチあんの? : 名無しさん@お腹いっぱい。 [sage] NGNG ありましゅよー ttp://www.cs.huji.ac.il/support/emacs/elisp-help/elisp-manref/elisp_34.html でも、{m,n}? の最短マッチはないみたい…。 : 名無しさん@お腹いっぱい。 [sage] NGNG 最短マッチに対応した grep ってある? : 名無しさん@お腹いっぱい。 [sage] NGNG grep が最短マッチに対応してるかどうかが問題になるケースってある? : 名無しさん@お腹いっぱい。 [sage] 05/01/30 22:46:31 [^ま]*まってかくのめんどくさい : 名無しさん@お腹いっぱい。 [] 05/02/26 05:47:57 あげ : 名無しさん@お腹いっぱい。 [] 2005/03/30(水) 02:33:49 up : 名無しさん@お腹いっぱい。 [ほしゅsage] 2005/04/19(火) 17:08:07 正規表現の実装っていろいろあることにやっと気づいた漏れorz : 名無しさん@お腹いっぱい。 [sage] 2005/05/14(土) 15:12:25 ほしゅ : 名無しさん@お腹いっぱい。 [] 2005/05/16(月) 16:51:45 abc xyzをaxbyczにしたいのですが : 名無しさん@お腹いっぱい。 [sage] 2005/05/16(月) 17:05:02 s/abc xyz/axbycz/g : 名無しさん@お腹いっぱい。 [sage] 2005/05/16(月) 19:33:57 ワロタ : 名無しさん@お腹いっぱい。 [sage] 2005/05/16(月) 19:34:25 保守 : 名無しさん@お腹いっぱい。 [] 2005/05/17(火) 22:45:20 echo abc xyz |sed -e "s/^/%/; :ll; s/[%]\(.\)\(.*\) \(.\)\(.*\)/\1\3%\2 \4/; tll; s/%//;" : 名無しさん@お腹いっぱい。 [sage] 2005/05/18(水) 00:13:40 うひょー : 名無しさん@お腹いっぱい。 [ほしゅsage] 2005/05/28(土) 03:19:18 うに厨として、% をめぐる動きに溜息出た…真剣にありがと 何重にも目が覚めた : 名無しさん@お腹いっぱい。 [sage] 2005/05/28(土) 05:32:41 abc xyz でも abcdefg ABCDEFG でもできるね。すげーや。 : ◆2fmGY.thDg [sage] 2005/06/02(木) 22:17:25 a : 名無しさん@お腹いっぱい。 [sage] 2005/06/04(土) 23:07:23 ('A`) : 名無しさん@お腹いっぱい。 [sage] 2005/06/19(日) 02:53:08 Onigurumaを使っているんですが、 あるテキストデータがあります。 ----- ここから END 注釈 ○○○ 注意 △△△ 補足 ◎◎◎ TITLE ----- ここまで という部分の、ENDの後の空白行からTITLEの前の空白行の部分(間の行)を削除して、 ENDとTITLEの間は1行だけの空白行にしたいです。 「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、 これは私の正規表現の式が間違えているんでしょうか? (複数行を1度に選択する方法を間違えている???) : 名無しさん@お腹いっぱい。 [sage] 2005/06/19(日) 03:13:31 つーか、正規表現だけ見せられても判断できないと思うんだけど。 改行処理や文字コードのオプション設定はどうしてるかとかいろいろ情報が足りない。 : 名無しさん@お腹いっぱい。 [ほしゅsage] 2005/07/13(水) 09:25:56 素直に、 ~s/END(\s*.*?\s*)TITLE/END\n\nTITLE/sg; じゃダメ? : 名無しさん@お腹いっぱい。 [sage] 2005/07/13(水) 13:15:24 Oniguruma の質問なわけだが? : 名無しさん@お腹いっぱい。 [ほしゅsage] 2005/07/13(水) 17:54:26 …とは思ったのだが、Perl 互換らしーから、いーかなとw てか、見つかるのむちゃくちゃ早いなww 事後ながら、oniguruma (ライブラリ)取りに行った : 名無しさん@お腹いっぱい。 [sage] 2005/07/13(水) 19:58:46 > 見つかるのむちゃくちゃ早いなww どういうこと? : 名無しさん@お腹いっぱい。 [sage] 2005/07/17(日) 23:17:41 >494 > 「END\s^[0-9a-zA-Z。-゜ぁ-んァ-ヶ亜-?]*\sTITLE」を指定してもマッチしないんですが、 > これは私の正規表現の式が間違えているんでしょうか? > (複数行を1度に選択する方法を間違えている???) これのどこが、複数行を一度に選択しているの? : 名無しさん@お腹いっぱい。 [sage] 2005/07/19(火) 19:22:13 ONIG_OPTION_MULTILINE (や REG_NEWLINE や RE_OPTION_MULTILINE など) をセット しているかどうかで複数行選択できるかどうか変わるので、 そのへんを晒せばもうちょっと状況がわかると思うのだが、 元質問者はもう既にどっかいっちゃったのだろうな。 : 名無しさん@お腹いっぱい。 [] 2005/09/21(水) 20:57:28 正規表現で ○○ か ○○の場合と言うのはどう表現するのでしょうか? Cで言う、 || のようなものです。 : 名無しさん@お腹いっぱい。 [sage] 2005/09/21(水) 21:07:45 テンプレに何もないんだなこのスレ。 このあたりで調べろ ttp://www.kt.rim.or.jp/%7Ekbk/regex/regex.html : 名無しさん@お腹いっぱい。 [sage] 2005/09/21(水) 21:18:44 \(>∀<\) キャー : 名無しさん@お腹いっぱい。 [sage] 2005/09/21(水) 21:58:13 (;`∇´))))))))))) \(>∀<\) キャー : 名無しさん@お腹いっぱい。 [sage] 2005/09/21(水) 22:48:45 俺ならこう→「\(○{2}\) か \1の場合」 : 名無しさん@お腹いっぱい。 [sage] 2005/09/21(水) 23:46:20 何気に正規表現本もラッシュだな。 : 名無しさん@お腹いっぱい。 [sage] 2005/09/22(木) 00:19:11 \([^ ]∀[^ ]*\) AAみたいな正規表現を作りたいが難しい。 : 名無しさん@お腹いっぱい。 [sage] 2005/09/22(木) 02:52:41 つくれてるやん! : 名無しさん@お腹いっぱい。 [sage] 2005/09/23(金) 23:15:15 ∀ がメタキャラになってくれると楽しいかも : 名無しさん@お腹いっぱい。 [sage] 2005/09/26(月) 20:32:51 дも : 名無しさん@お腹いっぱい。 [sage] 2005/09/28(水) 14:54:06 ネタキャラ : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 01:04:17 純粋に興味の問題なんだけど、 「ある文字集合の要素が各1回ずつしか出現しない」という文字列は 正規表現で表現できる? 例えばA, B, Cの文字からなる言語を考えたとすると、 ABC ACB BAC BCA CAB CBAの6つの文字列にマッチする表現っす。 : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 01:08:23 文字集合の濃度が有限なら 単に | でつなげばいいな。 : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 02:30:43 いろは歌とか"a quick brown fox..."みたいなのにマッチさせる正規表現、 って書けば説明が早かったかもですね。 ひらがなの場合で47!個、アルファベットの場合で26!個の文字列を |でつなぐってことになると思うんですが、やはりこれしか方法ないんですかね。 正規表現の長さは… アルファベットの場合でも約1京テラバイトか… orz : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 09:42:38 [^A]*A[^A]* ではどうよ : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 09:53:24 BBA にもマッチしちゃうんでは。 : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 09:57:44 > "a quick brown fox..."みたいなのに o 2回出てるよ。 実用を考えたら正規表現以外でやった方がいいな。 : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 19:50:27 いろは歌って内容も傑作だよな。 : 名無しさん@お腹いっぱい。 [sage] 2005/12/09(金) 21:53:37 > o 2回出てるよ。 おお、32年生きてて初めて気が付いたっす。漏れの目はfusianasanさんだ… orz > 実用を考えたら正規表現以外でやった方がいいな。 そうことになっちゃいますかね。みなさんレスどうもでした。 : 名無しさん@お腹いっぱい。 [] 2005/12/11(日) 08:09:16 Windowsで正規表現にマッチする文字列のみ(行全体じゃなく)を表示・保存するにはどうすればいいのでしょうか? xyzzyとかのエディタのgrepでやろうとしたのですが、検索してもよくわかりません。 Rubyとかスクリプト言語を使わないと無理でしょうか? : 名無しさん@お腹いっぱい。 [sage] 2005/12/11(日) 08:13:57 上すいません。書きこむスレ間違えました。(プログラム板の正規表現スレに書きこんだつもりでした。) : 名無しさん@お腹いっぱい。 [] 2005/12/11(日) 11:19:25 ちょうど一回出るんなら何かの順序でソートして文字列が完全一致することをチェックかなあ : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 11:16:33 エディターの正規表現で置き換えをしたいんですが・・・ 1、2、3、・・・という連番を (1) (2) (3)というふうに置き換えたいのですが どうしたらよいでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/01(日) 11:57:28 まずは(ry : 名無しさん@お腹いっぱい。 [sage] 2006/01/01(日) 12:39:56 置換元:[1-9] 置換先:(\0) で、できるかもよ。 : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 17:30:57 だめでした。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/01(日) 19:50:58 置換元:[1-9][0-9]* 置換先:\(\0\) こんな風にすればできるのかな? どんな風に駄目だったかわからないけれど。 : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 20:02:16 それもやってみましたが、検索はされるのですが、 置き換えが出来ません。(0)となってしまいます。 前回のは(となってしまいます。 エディターだから駄目なのでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/01(日) 20:09:51 \0のところを、 \1 $1 にしても同じかな? : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 20:13:18 ($1)となってしまいます。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/01(日) 20:17:25 そのエディタの正規表現がreference(\1とか$1とか)をサポートしてないに1票。 : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 21:27:04 !(^^)!ピンポーンです。 ヘルプを見ていたら、referenceはサポートしていないと出ていました。 他のエディターを探すか、どうしたらいいでしょうか。 : 名無しさん@お腹いっぱい。 [] 2006/01/01(日) 23:17:07 続きです 結局QXエディタをダウンロードして使いました。 びっくりしたのはWindows上では 正規表現というのは全然一般的ではないんですね。 勉強しようにも正規表現サポート自体が脆弱だったんですね。 : 【大凶】 3回目 [sage] 2006/01/01(日) 23:32:29 ググればなんぼでも出てきます。少し自分で考えなはれ。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/03(火) 22:49:27 まあやることがハッキリ決まってるんなら、 (念の為)対象ファイルのカレントディレクトリのDOS窓を開いてsed、だな。 : 名無しさん@お腹いっぱい。 [] 2006/01/07(土) 07:00:27 {aaa}[bbb}{ccc} という文字列から、aaa bbb cccをそれぞれマッチさせてとりだしたいので、 /¥{(.*)¥}¥{(.*)¥}¥{(.*)¥}/ としていましたが、 とりだしたい文字列のなかに、さらに{}がはいっていることがあることが わかりました。 {aaa}[b{b}b}{ccc} とか。 それぞれaaa b{b}b cccというかたちでとりだしたいのですが、どうしたものでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 10:07:50 sedはそのままでok : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 14:56:41 グループ化用のカッコにエスケープが必要だからsed「では」ダメじゃないの? Perlならエスケープ不要なので大丈夫。 ところではテクニシャンだな。 navi2chで円マーク(¥じゃないほう)を表示させやがって… : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 15:36:35 ヒント:}{ : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 15:46:46 いや、それは分かってるつもりだけど。 sedだと例えば{(aaa)}{(bbb)}{(ccc)}にマッチしちゃいますよってこと。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 17:31:15 じゃあ不必要な{}()を最初にスペースに変換してからマッチさせたら : 名無しさん@お腹いっぱい。 [sage] 2006/01/07(土) 18:58:38 そんな必要ない。sedでものカッコをすべてエスケープすれば良い。 の「sedは」というのが余分だっただけ。 : 名無しさん@お腹いっぱい。 [] 2006/01/12(木) 05:55:00 郵便番号をPHPで「1234567」から「123-4567」へ整形する正規表現を教えて下さい。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/12(木) 11:06:51 【PHP】質問スレッドpart32【php】 ttp://pc8.2ch.net/test/read.cgi/php/1136276300/ : 名無しさん@お腹いっぱい。 [sage] 2006/01/13(金) 16:59:36 すいません。 -------------------------------- #hogehoge fugafuga 1 -------------------------------- という風に行頭が#じゃないというのを正規表現で取得したいのですが 「ではない」というのが分かりません。 bashを用いております。 以上 ご助力をお願いいたします。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/13(金) 20:50:59 grep -v '^#' : 名無しさん@お腹いっぱい。 [sage] 2006/01/13(金) 21:08:39 grep '^[^#]' : 名無しさん@お腹いっぱい。 [sage] 2006/01/13(金) 21:29:57 いつも思うけど、 [^#] 形式だと文字が存在してないときも除外してしまうので 面倒なことあるよね。 ディレクトリリストから . .. を除外しようと [^.][^.].* を使って一文字のファイル見逃すとか。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/13(金) 21:47:30 その方が便利なこともある。 : 544 [sage] 2006/01/16(月) 17:54:29 ご教授ありがとうございます。 本当に助かりましたっ : 名無しさん@お腹いっぱい。 [] 2006/01/22(日) 02:37:32 正規表現の正規表現ってどうかきますか? ある値が正規表現の構文に沿っているかどうかを調べたいとき。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/22(日) 02:48:16 入れ子があるから正規表現にはならない。 BNFを書けば3型文法に属さないこと分かるでしょ。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 11:22:53 いきなりすんません 2ちゃんねるブラウザ Jane Doe Style で正規表現検索を使おうとしたけど、書き方がいまいち分かりません。 F900i という文字列だけを検索して F900is や F900iT はヒットさせないようにするには、どう書けば良いですか ぐぐってもいまいちわからないので。。。。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 11:25:48 板違い。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 11:32:56 スマンです。でもスレタイ検索してもほかに質問できそうな場所なかったんけどだめですか。 UNIX 085 正規表現 (553) プログラム 408 正規表現part2 (102) プログラマー 283 【Regular】正規表現【Expression】 (36) : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 11:36:10 板違い。 : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 11:49:12 逝 : 名無しさん@お腹いっぱい。 [sage] 2006/01/26(木) 13:16:13 Jane Doe Style とやらがどんな正規表現エンジンを使っているかにも 激しく依存する話なので、 まずはそのソフトのスレで聞いてみた方が良いと思う。 : 名無しさん@お腹いっぱい。 [] 2006/04/15(土) 16:30:37 (・∀・) : 名無しさん@お腹いっぱい。 [] 2006/04/18(火) 03:51:57 onigruma... 気になる。名前が怖い。 : 名無しさん@お腹いっぱい。 [sage] 2006/04/18(火) 09:54:32 nekoguruma だったら弱そうだしな : 名無しさん@お腹いっぱい。 [sage] 2006/05/02(火) 22:56:16 いろいろ運べそうじゃないか : 名無しさん@お腹いっぱい。 [] 2006/05/29(月) 20:29:06 正規表現厨には grep --color : 名無しさん@お腹いっぱい。 [sage] 2006/05/31(水) 19:33:06 勉強ついでに554を考えてみた。精度に難がありそうですが、以下でどうだろう? [^A-Zz-z0-9]*F900i[^A-Za-z0-9]* : 成瀬 ◆NBGqNARUSE [sage] 2006/06/16(金) 03:35:29 最低限試そう。"F900iS"=~/[^A-Zz-z0-9]*F900i[^A-Za-z0-9]*/ はマッチする。 ヒント: \W \b 否定先読み : 名無しさん@お腹いっぱい。 [sage] 2006/07/25(火) 12:40:49 ... Doll ←ここから \=\-\--\-``--`\=`-==\ \=-\=-\``\==`=`--`-=- Egg -=-\-=-\-\=-=--\=-=-=\ -=-\-=-=\=-=\=-=-\-=\- ←ここまで Fruits ... のときDoll〜Eggの項目まで抽出するにはどうしたらいいですか? /Doll/,/Fruits/ でおおまかには抽出できるけどもっと正確に抽出したいのです : 名無しさん@お腹いっぱい。 [] 2006/08/09(水) 21:11:53 『詳説 正規表現 第3版』 が今月発売されるね。 邦訳版の出版は知らんけど。 : 名無しさん@お腹いっぱい。 [sage] 2006/08/10(木) 13:32:24 情報サンクス。 けど、洋書なら原書のタイトル表記でよろしく。 早とちりして必死で oreilly.co.jp と amazon.co.jp 探しちゃったよー。(←あほ) : 名無しさん@お腹いっぱい。 [sage] 2006/08/10(木) 21:53:00 ttp://www.oreilly.com/catalog/regex3/index.html わざわざ、邦訳版の出版は知らんって書いたのになw : 名無しさん@お腹いっぱい。 [] 2006/08/18(金) 16:48:08 ttp://oraclesqlpuzzle.hp.infoseek.co.jp/regex/index.html 正規表現の問題集らしい : 名無しさん@お腹いっぱい。 [] 2006/08/18(金) 17:01:57 作者宣伝乙、 というのは冗談で、情報ありがと。 日本語版はいつ出るんだろ。 : 名無しさん@お腹いっぱい。 [sage] 2006/08/23(水) 13:58:51 立ち読みとか読んだうちに入らんと思われた。 : 名無しさん@お腹いっぱい。 [] 2006/08/23(水) 17:31:35 ttp://oraclesqlpuzzle.hp.infoseek.co.jp/regex/regex-4-10.html こんなのもあるみたいやね : 名無しさん@お腹いっぱい。 [sage] 2006/10/05(木) 15:46:12 age : 名無しさん@お腹いっぱい。 [] 2006/10/16(月) 10:51:27 ageとくか : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 01:00:23 質問させてください。 正規表現を用いたgrepをするときに、 文字列"foo"を含まない全ての行にマッチさせるためには どのように書けばよいのでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 01:13:12 -v : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 08:26:14 man に書いてあるよ。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 08:26:50 -v オプションを使わずに、正規表現上で「文字列"foo"を含まない」を表す方法を 聞いているんじゃないだろうか? : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 09:48:51 (?!foo) : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 11:12:35 今はgrepでの話をしてんだろ。 : 名無しさん@お腹いっぱい。 [] 2006/10/17(火) 13:02:02 否定先読み : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 13:37:52 正規表現でできるものか! 先読み、後読み共に否定は貧弱 : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 18:14:48 「一致しない」はあらゆる箇所にマッチするからね 行単位の処理とは基本的に相容れないし 正規表現でなく、-vのようなメタレベルで対処するのが正解 sedとかでもいいな : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 19:17:42 なんで、.*?(?!xxx) を、xxxが一切含まない行、と解釈してくれないんですかね? : 名無しさん@お腹いっぱい。 [sage] 2006/10/17(火) 19:55:43 論理的に考えてみればわかるよ : 名無しさん@お腹いっぱい。 [sage] 2006/10/18(水) 09:59:12 欲張りマッチだから、xxxが見つかった段階で一文字戻ってマッチにしちゃう? : 名無しさん@お腹いっぱい。 [] 2006/10/18(水) 11:10:22 解釈するわけがない : 名無しさん@お腹いっぱい。 [] 2006/10/20(金) 10:45:16 ^(?!.*foo) でできるだろ ttp://pc8.2ch.net/test/read.cgi/tech/1156413899/l100 の1のサイトをよく読め : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 10:00:30 正規表現でできることの仕様ってずっとこのままなんですかね。 括弧の対を考慮した表現とかって簡単にならないかな。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 11:17:38 処理系ごとに拡張してあったりするじゃん。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 11:28:08 hp-uxのgrep糞だなw \< \>が使えん。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 12:07:18 grepツールで、htmlのコメント内を検索対象からはずしてgrepできるツールありますか? コメントで死ぬほど引っかかって苦労してます。 複数行コメント中の真ん中ぐらいの行に引っかかっても、先頭に<!--がないから 普通のgrepツールだときびしいです。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 12:13:02 sedしかないだろ。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 12:24:01 -- の対応まで見ようとするとつらそうだ。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/24(火) 21:37:54 複数行になると途端にわけわからんくなるな・・・。 : 名無しさん@お腹いっぱい。 [sage] 2006/10/26(木) 05:24:59 改行位置を変換する前処理をしてからやるとか : 名無しさん@お腹いっぱい。 [sage] 2006/10/26(木) 11:38:24 コメントを s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g で取り除いてからgrepすればいいんじゃね? : 名無しさん@お腹いっぱい。 [sage] 2006/11/03(金) 14:20:22 マルチで済まない。 同じ文字が3文字連続していたら表示したいのだが : 名無しさん@お腹いっぱい。 [sage] 2006/11/03(金) 15:02:08 >s/<!(?:--[^-]*-(?:[^-]+-)*?-(?:[^>-]*(?:-[^>-]+)*?)??)*(?:>|$(?!\n)|--.*$)//g この部分はsed? だったら、その後もgrepなんかせずに、sedだけで完結すればいいじゃん。 awkでも同じく。 : <sage> [] 2006/11/10(金) 19:30:45 教えて下さい。 ダブルクオートで囲まれていない、コンマだけを置き換えたいのですが、 正規表現では、どうあらわせばいいのでしょうか? 例: "aaa, bbb" xxxx, "ccc, ddd" yyyyyy xxxx, <- このコンマを −> xxxx; とセミコロンにしたいです。 よろ : 名無しさん@お腹いっぱい。 [] 2006/11/13(月) 23:01:55 ttp://pc8.2ch.net/test/read.cgi/tech/1156413899/l100 のリンク先嫁 : <sage> [] 2006/11/14(火) 15:35:11 >> 603 そのページのどこを読めと? : 名無しさん@お腹いっぱい。 [sage] 2006/11/22(水) 14:36:47 ほぼ全部 雑魚には無理な正規表現ってこった : 名無しさん@お腹いっぱい。 [sage] 2006/11/22(水) 20:49:29 氏ね : 名無しさん@お腹いっぱい。 [sage] 2006/11/26(日) 13:47:54 ◆関連サイト 正規表現メモ ttp://www.kt.rim.or.jp/~kbk/regex/regex.html Perl正規表現雑技 ttp://www.din.or.jp/~ohzaki/regex.htm Regular Expression(Riue ちゃんの正規表現講座) ttp://www.sixnine.net/regexp/ 正規表現パズル ttp://oraclesqlpuzzle.hp.infoseek.co.jp/regex/ 詳説 正規表現 ttp://www.oreilly.co.jp/books/4873111307/ 正規表現プログラミングFAQ ttp://capslockabcjp.kitunebi.com/faq.html これだけ読めば解決できるが 池沼には無理 : 名無しさん@お腹いっぱい。 [sage] 2006/12/04(月) 14:18:49 アルファベットの文字で構成されるが、「d」は入らない、を [a-ce-z]以外の書き方で表現する方法はないですか? もちろん↓はエラーだけど、こんな漢字で書ければいいのだけれど。 [a-z][^c] : 名無しさん@お腹いっぱい。 [sage] 2006/12/04(月) 19:22:18 a|b|c|e|f|g|h|i|j|k|l|m|n|o|p|q|r|s|t|u|v|w|x|y|z : 名無しさん@お腹いっぱい。 [sage] 2006/12/04(月) 22:02:59 javaならできる : 名無しさん@お腹いっぱい。 [sage] 2006/12/04(月) 22:08:51 d|i|g|i|t|a|l : 名無しさん@お腹いっぱい。 [sage] 2006/12/05(火) 09:35:00 どうやるんだべさ? : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 02:45:07 [[a-z]&&[^d]] こんな感じだったと思う。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 09:44:34 うぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉぉ〜、すげぇ〜。できました! javaだとこんなのができるのか! もちろん正規表現標準じゃないので、perlとか秀丸正規表現ではできないかぁ・・・ javaならではの裏技って他に何かあるんですかね? : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 12:20:30 うぉ++ : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 12:23:51 タイプ数増えてるのは問題ないのかw : 615 [sage] 2006/12/06(水) 12:51:07 わざわざjavaで試した行動力に感服 強欲マッチといわれる615もためしてみるといい : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 13:11:31 java使う人ならタイプ数が増えることが問なさそう : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 14:12:54 うぉ+でいいんじゃないの?なんか違うの? : 名無しさん@お腹いっぱい。 [sage] 2006/12/06(水) 17:58:50 (+_+;) : 名無しさん@お腹いっぱい。 [sage] 2006/12/07(木) 02:56:32 違うよ。++が付いたほうはバックトラックしない。 Perlの (?> ...) と同じ。 : 名無しさん@お腹いっぱい。 [saga] 2006/12/16(土) 17:28:28 1〜1000 までの数字から始まって最後が C] で終わる正規表現を教えて下さい m(_ _)m : 名無しさん@お腹いっぱい。 [sage] 2006/12/16(土) 17:45:19 ^[0-9]\{1,4\}[^0-9]*C]$ かな? : 名無しさん@お腹いっぱい。 [saga] 2006/12/16(土) 17:55:45 駄目でしたorz 正規表現の勉強してきます。 有難うございましたm(_ _)m : 名無しさん@お腹いっぱい。 [sage] 2006/12/16(土) 19:58:43 ^([1-9][0-9]\{0,2\}|1000)[^0-9]*C]$ こうか? : 名無しさん@お腹いっぱい。 [] 2006/12/17(日) 00:31:38 タイトル:文字列 の文字列の部分だけを取り出したいのですが、 どのような正規表現にすれば良いのでしょうか? よろしければ、ご教授を願います。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/17(日) 00:34:12 いろいろ出ているようだけど [0-9].*C] ではダメな理由がわからない : 名無しさん@お腹いっぱい。 [sage] 2006/12/17(日) 00:52:14 文.. : 名無しさん@お腹いっぱい。 [sage] 2006/12/17(日) 07:34:54 全然ダメ 0000C がヒットする : 名無しさん@お腹いっぱい。 [] 2006/12/28(木) 11:54:55 初歩な質問ですみませんが [0-9a-zA-Z]で英数字にマッチするものとなると思うのですが 例えばajgko-jk-s1olのように「-」記号が入っているとマッチしません どう記述すればよいですか?よろしくお願いします。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 11:57:12 [-0-9a-zA-Z] : 630 [] 2006/12/28(木) 12:01:22 さんありがとうございます。 しかし上記のように記述しても読み込んでくれません・・・。 こう記述して[-0-9a-zA-Z]{10,10} 「BC-K-o58tB」これを認識してくれません。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 12:09:19 どのアプリ使ってんのよ : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 12:10:47 ちゃんとマッチするけど・・ ↓ $ echo 'BC-K-o58tB' | egrep '[-0-9a-zA-Z]{10,10}' BC-K-o58tB : 630 [] 2006/12/28(木) 12:11:07 アプリ?良くわかりませんが言語PHPです。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 12:11:52 ならPHPのスレで聞いた方がいいんじゃね : 630 [] 2006/12/28(木) 12:16:40 PHPのスレで聞いたら正規表現に行けと言われました。orz : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 14:04:02 無限ループキタ━━━━━━(゚∀゚)━━━━━━ !!!! : 名無しさん@お腹いっぱい。 [sage] 2006/12/28(木) 21:33:37 PHPだとPOSIX由来の正規表現とPerl互換の正規表現があるけどどっち? 後者を使っているならpreg_match('/[-0-9a-zA-Z]{10,10}/', $str)みたいに 正規表現の前後にスラッシュが必要。 : 名無しさん@お腹いっぱい。 [sage] 2006/12/29(金) 11:07:30 正規表現 part 3 ttp://pc8.2ch.net/test/read.cgi/tech/1156413899/ : 名無しさん@お腹いっぱい。 [] 2007/01/09(火) 23:17:53 始めたばっかりで、3時間かかってもダメです… お助けを。 ()で囲まれる任意の文字部分だけをとりたいんですが、 \(..*\) では全然ダメですね… ()もついてくるし。 *****(ABC-_)(123%&)*****(あいう)*** 上の例だと、以下の3つを取りたいです。 ABC-_ 123%& あいう : 名無しさん@お腹いっぱい。 [sage] 2007/01/09(火) 23:43:33 sed -e "s/(.*)/()/g" でどうよ : 名無しさん@お腹いっぱい。 [] 2007/01/10(水) 00:12:39 Unix版でしたね… Windows系でのやり方を知りたいです。 : 名無しさん@お腹いっぱい。 [sage] 2007/01/10(水) 00:19:56 基礎からやり直せ。 : 名無しさん@お腹いっぱい。 [sage] 2007/01/10(水) 01:41:33 なんか冗長だが... use strict; use warnings; while(<>){ s{(?:[^(]*)\(([^)]*)\)(?:[^(]*)}{[$1]}g; print $_; } : 名無しさん@お腹いっぱい。 [sage] 2007/01/10(水) 01:42:28 Windowsにもsedは移植されてるじゃん。 : 名無しさん@お腹いっぱい。 [sage] 2007/01/10(水) 01:59:51 板違い。 : 名無しさん@お腹いっぱい。 [] 2007/01/18(木) 10:55:44 正規表現でググレカス : 名無しさん@お腹いっぱい。 [] 2007/02/07(水) 08:21:33 すみません、以下の正規表現は何にマッチするんでしょうか? ([\011\012\014 -~]+\\|\\(\\cj\\|\n\\)+\\) 処理系はLispです。お願いします。 : 名無しさん@お腹いっぱい。 [sage] 2007/02/08(木) 02:57:00 LispつかEmacs Lispだろ。先頭に \\ が抜けてないか? [\011\012\014 -~]+ タブかLFかCRかスペースかASCIIの表示可能文字の繰り返し \\| または \\(\\cj\\|\n\\)+ Cjって多バイト文字でいいんだっけ? か改行の繰り返し : 649 [sage] 2007/02/08(木) 15:45:20 すみません、おっしゃる通り先頭に\\が抜けていました。 なるほど、どうもありがとうございました。 : 名無しさん@お腹いっぱい。 [] 2007/03/27(火) 16:10:01 コンマはエスケープする必要はありますか? We are NOVA-TOMO\, right? : 名無しさん@お腹いっぱい。 [] 2007/03/27(火) 17:34:57 必要ないと思った。付けても問題ないと思うけど。 むしろ?の方が… 俺詳しくないから何ともいえないけど : 名無しさん@お腹いっぱい。 [sage] 2007/03/28(水) 01:44:02 カンマはどの正規表現でもメタ文字じゃないのでエスケープの必要はない。 むしろ のいうとおりで ? が要注意。 grep/sed ならエスケープなしでOK。 egrep/awk/perl その他Perl互換のものなら要エスケープ : 名無しさん@お腹いっぱい。 [] 2007/04/21(土) 22:17:17 当方、秀丸を使っております。 “・”で始まる文で、「」で囲まれた文をヒットさせるのにはどうすればよいのでしょうか? どうしても、「」で囲まれる前の文章もヒットしてしまうのです。 : 名無しさん@お腹いっぱい。 [sage] 2007/04/21(土) 22:55:33 秀丸とやらはUnixで動くのかい? : 名無しさん@お腹いっぱい。 [] 2007/04/21(土) 23:03:01 げ、UNIX版でしたか! 失礼しました。 : 名無しさん@お腹いっぱい。 [] 2007/05/04(金) 12:21:16 ニフティーのドメイン以外を拾う為に [^nifty]\.com と書くのは間違いのようですが 特定の“文字列”以外を指定するのはどーすりゃいいの? : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 12:44:28 否定先読みなどの拡張があればそれを使えばいいが、なくても それ以外の文字列をすべて列挙すればなんとかなります。 : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 13:59:38 grep -v '特定の文字列' filename : 名無しさん@お腹いっぱい。 [] 2007/05/04(金) 14:35:47 正規表現の話では? ([^n]....|.[^i]...|..[^f]..|...[^t].|....[^y])\.com これが正解 : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 14:54:42 nifty.com以外のナントカ.comにマッチさせたいのだから、 ([^n].*|n[^i].*|ni[^f].*|nif[^t].*|nift[^y].*)\.com ではないか? : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 14:56:11 無理に正規表現でがんばるより 他の方法を探した方がいい。 : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 14:58:05 それではniftyhoge.comにマッチしないので ([^n].*|n[^i].*|ni[^f].*|nif[^t].*|nift[^y].*|nifty..*)\.com : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 15:58:18 perlならもうちょっと簡単? perl -ne 'print if /(?<!nifty)\.com/' grep -v とか否定を使うほうが素直だと思うけど。 : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 16:31:54 ヒネクレたひとたちばかりいるスレですから : 名無しさん@お腹いっぱい。 [sage] 2007/05/04(金) 16:44:04 このスレの中くらいは正規表現原理主義でいいじゃないか : 名無しさん@お腹いっぱい。 [] 2007/05/05(土) 00:26:33 その為のスレなんだから当然といえば当然だろ : 名無しさん@お腹いっぱい。 [111111111111111111111111111111111111] 2007/05/21(月) 19:09:39 はふ : 名無しさん@お腹いっぱい。 [sage] 2007/05/28(月) 22:36:56 -rwxrwxr-x 1 53 53 3504 May 22 2006 index.htm drwxrwxr-x 4 53 53 4096 May 6 2006 common drwxrwxr-x 2 53 53 4096 May 22 2006 tmp drwxrwxr-x 2 53 53 4096 May 22 2006 image ↑から<属性>(-rwxrwxr-x)と<名称>(index.htm)の部分をグループ化で取り出したいのですが、どのようにすればよいのでしょうか? : 名無しさん@お腹いっぱい。 [] 2007/05/28(月) 22:48:40 ここは実は分かってない奴しかいねーから無理じゃね?ww : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 00:05:12 グループ化って言うのがよくわからんけど、パーミッションの部分とファイル名の部分だけ取り出したいなら $ perl -e 'while(<>){ if(/^([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*([^\s]*)\s*(.*)$/){ print "$1 $9\n"; }}' < test.txt -rwxrwxr-x index.htm drwxrwxr-x common drwxrwxr-x tmp drwxrwxr-x image $ ぐらいからはじめればいい。 : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 01:44:17 確かにみんなもっとスマートに書けないものかねえ・・・ : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 02:31:04 ^([^\s]+)(.*)([^\s]+)$ $1 $3 : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 03:06:51 (; ^ω^) : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 07:07:47 むしろ正規表現使わないでreaddirとstat使うとこじゃないか? : 名無しさん@お腹いっぱい。 [sage] 2007/05/29(火) 15:00:33 $ ls -al | sed -e 's/ \{1,\}/ /g' | cut -d ' ' -f 1,9 cut 使うのは反則? : 名無しさん@お腹いっぱい。 [sage] 2007/05/30(水) 16:06:37 awk '{print $1,$9}' で十分では無かろうかと : 名無しさん@お腹いっぱい。 [sage] 2007/09/01(土) 07:33:23 gawkでJavaソースファイル内の「識別子」単位の置き換えをしようとしていますが, なかなかうまくいきません. たとえば,独立して現れる「Stack」は「Queue」に置き換えるが, 「argStack」は別の識別子だから「argQueue」とは置き換えず そのままにしておくというものです. Javaの識別子は[_0-9A-Za-z]の文字だけから構成されるとしています. awk以外の選択肢も含めて,よい方法がありますでしょうか? 最終的には,Javaで置換プログラムを書けばできなくもないとは思いますが, 安直な方法があればお教えください. : 名無しさん@お腹いっぱい。 [sage] 2007/09/01(土) 08:57:42 \< \> で囲っておくとか。 : 679 [sage] 2007/09/01(土) 19:15:56 grepの「-w」は普通にできるのに,いざ置換で同じことをしようとすると 難しいですね. 結局Javaで処理プログラムを書きました.ありがとうございました. : 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 09:09:36 hogeを含む行のうち^\s*'で始まらないもの をgrepするのにvimでは \(^\s*'.*\)\@<!hoge でできるようなんですが、サクラで (?<!^\s*'.*)hoge とするとダメでした。 これをgrepするにはどうすればいいでしょうか? サクラ(bregexp.dll)の正規表現はPerl5互換だそうなんですが。 : 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 09:53:00 板違い。 : 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 11:08:21 じゃあ hogeを含む行のうち^\s*'で始まらないもの にマッチするPerl5正規表現を答えよ。 とします。 : 名無しさん@お腹いっぱい。 [sage] 2007/11/21(水) 11:28:24 ム板行け。 : 情報工学ばが [] 2008/01/15(火) 20:48:47 正規表現ってなんですか? : 情報工学ばが [] 2008/01/15(火) 20:50:24 はやく!!! 単位がないんです!! : 情報工学ばが [] 2008/01/15(火) 20:51:45 お願いします。。。 : わし [] 2008/01/15(火) 20:55:01 わしにはわからん。 : 名無しさん@お腹いっぱい。 [sage] 2008/01/16(水) 01:21:45 【サルにもわかる正規表現入門】 ttp://www.mnet.ne.jp/~nakama/ : 名無しさん@お腹いっぱい。 [] 2008/01/16(水) 12:24:11 有難うございました。 おかげで単位取れそうやでー!! ほな : 名無しさん@お腹いっぱい。 [] 2008/01/17(木) 00:37:01 語り手緊急募集中!! 坐禅と見性第54章 片手の他人がたたく拍手の音 ttp://life9.2ch.net/test/read.cgi/psy/1192448109/ 【仏教】悟りを開いた人のスレ 10 【鬼和尚】 ttp://life9.2ch.net/test/read.cgi/psy/1200142232/ 【悟りで居る】悟りを開いた人スレ【完全お釈迦様派】 ttp://life9.2ch.net/test/read.cgi/psy/1198295563/ 萬福寺行った。1.2 ttp://love6.2ch.net/test/read.cgi/kyoto/1188809052/ 【茶の湯】 大徳寺について 【禅文化】 ttp://love6.2ch.net/test/read.cgi/kyoto/1145457556/ 臨済宗 大本山天龍寺 2 ttp://love6.2ch.net/test/read.cgi/kyoto/1183216094/ 【算盤】臨済宗 妙心寺派【金権】十五日は祝聖 ttp://love6.2ch.net/test/read.cgi/kyoto/1198725369/ ★★臨済宗・癖有り布教師さん★★ ttp://love6.2ch.net/test/read.cgi/kyoto/1172800156/ 臨済宗国泰寺派について ttp://love6.2ch.net/test/read.cgi/kyoto/1151120179/ 臨済宗相國寺派について ttp://love6.2ch.net/test/read.cgi/kyoto/1146749623/ : 名無しさん@お腹いっぱい。 [] 2008/02/24(日) 13:39:51 2008-03 発売(予定) 「詳説 正規表現 第3版」 (Jeffrey E.F. Friedl 著 / 長尾高弘 訳) ISBN 978-4-87311-359-3 定価 5,040円 : 名無しさん@お腹いっぱい。 [sage] 2008/02/24(日) 17:10:30 バイト代が全部本で消えていく・・・ : 名無しさん@お腹いっぱい。 [sage] 2008/02/24(日) 18:03:30 あるある : 名無しさん@お腹いっぱい。 [] 2008/02/26(火) 14:03:08 2/1 XXXXXXXX 2/2〜2/5 XXXXXXXXX 2/7〜2/8 XXXXXXX 2/12 XXXXXXXXXX 2/20〜2/28 XXXXXXXXX と書かれた行があり 今日より以前の日付の行を削除するにはどうすればいいですか : 名無しさん@お腹いっぱい。 [sage] 2008/02/26(火) 15:50:38 それは正規表現の問題か? : 名無しさん@お腹いっぱい。 [] 2008/02/26(火) 17:23:03 Cの構造体のようにネストする可能性のあるものを正規表現で抽出するにはどうすればいいでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2008/02/26(火) 17:26:13 無理 : 名無しさん@お腹いっぱい。 [sage] 2008/02/26(火) 21:47:00 正解 : 名無しさん@お腹いっぱい。 [sage] 2008/02/26(火) 22:31:20 日付の切り出しを正規表現でやって、日付の判定以降はプログラムでがんばれ。 : 名無しさん@お腹いっぱい。 [] 2008/03/06(木) 14:24:40 sedを使って 2007/1/2 2007/1/23 2007/12/2 2007/12/31 のデータを 2007/01/02 2007/01/23 2007/12/02 2007/12/31 にするにはどうすればいいですか : 名無しさん@お腹いっぱい。 [sage] 2008/03/06(木) 14:28:44 sed -e 's,/1/,/01/,' -e 's,/2$,/02,' : 名無しさん@お腹いっぱい。 [sage] 2008/03/06(木) 17:14:22 9日近く書き込み無いのによく質問に高速で答えられますね 尊敬するとともに変態だと思います。 : 名無しさん@お腹いっぱい。 [sage] 2008/03/06(木) 17:15:08 別に何日書き込みがなかろうが関係ない。 : 名無しさん@お腹いっぱい。 [sage] 2008/03/06(木) 22:36:13 今時ブラウザでみてる奇特な人かな? 別にこのスレを毎日人手でチェックしてるわけじゃなくて、 専ブラの巡回リストに入ってるだけのことだと思うよ。 まあ、確かに4分でレスするのはちょっとすごいが よくよく見たら 2007/3/3 とかは変換しない... ほんとにそれでいいのか? : 名無しさん@お腹いっぱい。 [sage] 2008/03/06(木) 23:43:20 もわざとその答えにしたんだろ。 要するに質問の仕方が悪いって事だ。 : ウサチャソ ◆/0IEZmXnQ6 [sage] 2008/03/17(月) 21:53:04 ゼロサプレス 正規表現 とか ゼロパディング 正規表現 とかでググってみるといいかモナー 最近sedは使ってないから漏れはやり方知らんw : 名無しさん@お腹いっぱい。 [sage] 2008/03/18(火) 14:24:00 どの文字列にもマッチしない正規表現ってどう書くんでしょう? : 名無しさん@お腹いっぱい。 [sage] 2008/03/18(火) 16:47:03 (?<=a)a : 名無しさん@お腹いっぱい。 [sage] 2008/03/19(水) 09:09:37 空文字列にもマッチしない? : 名無しさん@お腹いっぱい。 [sage] 2008/03/19(水) 23:02:47 しないよ というか自分で試せよ : 名無しさん@お腹いっぱい。 [sage] 2008/03/21(金) 00:44:43 710って、aaにマッチするよ 戻り読みの位置が違うんじゃね? : 名無しさん@お腹いっぱい。 [sage] 2008/03/21(金) 20:07:35 (?!a)a こうかな : 名無しさん@お腹いっぱい。 [] 2008/06/02(月) 10:30:14 Vimでファイルの中からhttpで始まり、htmlで終るURLを抜きだしたいのですが、 どのようにすれば可能でしょうか? いろいろと試してはいるのですが、行中の最大にマッチする等なかなかうまくできません。 : 名無しさん@お腹いっぱい。 [sage] 2008/06/02(月) 11:38:21 最短でマッチさせたらさせたで、 ディレクトリのどこかに .html があると破綻する : 名無しさん@お腹いっぱい。 [] 2008/06/03(火) 08:27:21 emacs(の置換)と perlのそれぞれで、 「日本語の文字列」を指定する正規表現が知りたいのですが、 どこを見ればよいでしょうか? 「ASCII文字を含まない文字列」でもOKです。 : 名無しさん@お腹いっぱい。 [sage] 2008/06/03(火) 13:33:02 (info "(elisp)Regexp Backslash") | `\cC' | matches any character whose category is C. Here C is a character | that represents a category: thus, `c' for Chinese characters or | `g' for Greek characters in the standard category table. というのがあるんだけど、C の説明が無いね。 \cj だった気がするけど、不具合があるかもしれん。 ASCII 以外だと、↓これはいかが? (info "(elisp)Char Classes") | `[:multibyte:]' | This matches any multibyte character (*note Text | Representations::). : 名無しさん@お腹いっぱい。 [] 2008/06/03(火) 14:36:53 ありがとうございます。emacsのinfoではなく、 elisp infoにあるんですね。 「日本文字にはさまれたascii空白」を検索したかったので、 emacsでは"¥cj ¥cj" でだいたいよさそうです。 (どういうわけか [:multibyte:]や[:nonascii:] という指定は C-u C-s などではうまく動いてくれないようなのですが・・・ (ascii文字の一部にマッチしてしまう) : 名無しさん@お腹いっぱい。 [sage] 2008/06/03(火) 14:41:33 > (どういうわけか > [:multibyte:]や[:nonascii:] > という指定は > C-u C-s などではうまく動いてくれないようなのですが・・・ > (ascii文字の一部にマッチしてしまう) [[:multibyte:]] としんとだめやよ。 : 名無しさん@お腹いっぱい。 [sage] 2008/06/03(火) 18:33:15 あ、そういうことか!どもです。 : 名無しさん@お腹いっぱい。 [] 2008/09/04(木) 15:15:43 ttp://codezine.jp/article/detail/1573 やたら難しいのですが。 詳説正規表現を読めば、解けるようになりますかね? : 名無しさん@お腹いっぱい。 [sage] 2008/09/05(金) 01:34:49 難しいか? それ。 : 名無しさん@お腹いっぱい。 [sage] 2008/09/18(木) 18:37:47 プログラミングperlの正規表現の解説部分を 読んでもなんとかなるかも(´・ω・`) : 名無しさん@お腹いっぱい。 [sage] 2008/09/28(日) 20:34:23 詳説正規表現は文字通り「詳説」。 正規表現を使うことが目的の人にはヘビーすぎる。 : わいきむら [] 2008/10/20(月) 09:09:22 空の文字クラス'[]'はどういう意味になりますでしょうか? あと'-'が文字クラスの最後にある場合もダッシュとマッチせよ という意味になるのでしょうか? : わいきむら [] 2008/10/20(月) 09:12:46 すみませんダッシュじゃなくてハイフンですか : 船木康博 [] 2008/10/20(月) 09:14:08 さーてと、 パソコンに於ける衛生面についてカキコして、 とりあえずここらでアクティブソナーにQSYするかなー♪ ・VDT症候群に注意。 ・腱鞘炎に注意。 ・大音量による聴覚障害に注意。 マウスは玉の有り無しで、オスとメスがあるでよ。 光にも種類があるし、トラックボールもあるし。たまには玉の辺りの掃除でもしてやってくれ。 ボタンも林檎の1個や米窓の2個じゃなくて、SUNあたりなら3個あったんじゃねぇかなぁ。 最近じゃあ、ホイールも回転方向以外に左右に振れるのもあるでよ。 最後は、鍵盤だ。雑菌が繁殖して、便所より汚いモノもあるでなぁ。 病気移しちゃあいけねぇで、触らせる相手は自分で判断して制限しろよ。 おいもかはまぐり触った手かもしれねぇし、汁がとんでるかもしれねぇからな。 : 名無しさん@お腹いっぱい。 [sage] 2008/10/21(火) 02:39:30 中身が空の [] はわからんが、末尾のハイフンはその通り。 範囲指定じゃなくてハイフンそのものとして解釈される。 : 名無しさん@お腹いっぱい。 [] 2008/10/22(水) 17:48:58 質問させてください。 Fortranのコードから、「subroutine abc()」「 subroutine abs()」のような サブルーチンの開始行だけをgrepで抽出したくて grep ^\s*subroutine ./*.f90 と書いたのですが、「 subroutine」で始まる行がマッチしていないようです。 どのようにしたらこれをマッチさせられるか教えてください。 ちなみに、コード内には 「! subroutine abc()」「!subroutine abc()」なども含まれています。 : 730 [] 2008/10/22(水) 19:23:26 どなたか、ほんとお願いします!! : ウサチャソ ◆/0IEZmXnQ6 [sage] 2008/10/22(水) 21:00:29 ' とか " で括ってないとか? 話逸れるけど、grep は egrep が一番速いらしいよ。 egrep は「(・∀・)イイ!! 」grep! なんっつってw はぁ〜… : 730 [sage] 2008/10/22(水) 21:25:28 そのとおりでした。 grep "^\s*subroutine" ./*.f90 としたらうまくいきました、ありがとうございます。 .....なんでこんなことに.....orz orz orz : 名無しさん@お腹いっぱい。 [sage] 2008/10/23(木) 03:40:28 「(・∀・)イイ!! 」grep! : 名無しさん@お腹いっぱい。 [] 2008/11/08(土) 14:16:27 ムズいなこれ ttp://codezine.jp/article/detail/3039 ttp://codezine.jp/article/detail/2676 : 名無しさん@お腹いっぱい。 [sage] 2008/11/15(土) 20:26:45 機能的にegrepのが遅そうな気がするけど : 名無しさん@お腹いっぱい。 [sage] 2008/11/19(水) 14:37:34 正規文法(正規言語)には定義があるけど 正規表現に「数学的に厳密な定義」は存在しないと思うんだけどねー まあでがいしゅつだったからどうでもいいや : 名無しさん@お腹いっぱい。 [sage] 2009/04/26(日) 16:15:06 教えていただけますでしょうか。 1(文字列A)文字列B というものを (文字列A)文字列B にするのはどう書けばよいのでしょうか。 文字列A、文字列Bとも長さは不規則です。 : 名無しさん@お腹いっぱい。 [sage] 2009/04/30(木) 17:32:03 sed 's/^.//' : 名無しさん@お腹いっぱい。 [sage] 2009/04/30(木) 17:38:33 すみませんが詳しい方のみ回答をお願いします : 名無しさん@お腹いっぱい。 [sage] 2009/04/30(木) 18:41:27 日本語や英語など特定の文字列をgoogle検索のリンクにしたいです。 例えば、「正規表現」という文字列をgoogleのリンクにしたい場合だと、 正規表現(せいきひょうげん、regular expression)とは、 文字列の集合を一つの文字列で表現する方法の一つである。 ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ ↓ <a href=" ttp://www.google.co.jp/search?q=%90%B3%8BK%95 \%8C%BB">正規表現</a> (せいきひょうげん、regular expression)とは、 文字列の集合を一つの文字列で表現する方法の一つである。 としたいです。ただし ・繰り返し1語1語適用することで複数の単語をリンク化する または一発で複数の単語をリンク化する方法でもいい ・すでにリンクされているものを二重にリンクしない ・タグ内の文字列はリンク化しない ・英語は文章内の単語が完全一致すればリンク化し、 日本語は部分一致したらリンク化する ・英語の連語には対応しなくていい。 ・リンク化したい文字列が「正規」「正規言語」などのように 「正規」⊂「正規言語」という関係のものは想定しない 使う言語はAWK、Sed、Perlのいづれかとする。 お願いします。 : 名無しさん@お腹いっぱい。 [sage] 2009/04/30(木) 19:14:08 その質問は正規表現スレで扱う範囲を越えてます。 : 名無しさん@お腹いっぱい。 [] 2009/05/18(月) 22:21:54 8桁の10進数を文字列とみなしたとき、 下2桁が"00"でない文字列をヒットしたい。如何すればよいか? : 名無しさん@お腹いっぱい。 [sage] 2009/05/18(月) 22:33:28 [0-9]{6}[1-9]{2} : 名無しさん@お腹いっぱい。 [sage] 2009/05/19(火) 08:56:24 [1-9][0-9]{5}([0-9][1-9]|[1-9][0-9]) : 名無しさん@お腹いっぱい。 [sage] 2009/06/03(水) 22:23:08 正規表現でアルファベット6文字というのはどう書けばいいでしょう? [A-z][A-z][A-z][A-z][A-z][A-z] これじゃださいですよね? : 名無しさん@お腹いっぱい。 [sage] 2009/06/04(木) 09:42:14 [A-z]{6} : 名無しさん@お腹いっぱい。 [sage] 2009/06/04(木) 09:57:06 [A-z]だと[\]~_`を含むよ。[A-Za-z]{6}にしなはれ : 名無しさん@お腹いっぱい。 [sage] 2009/06/04(木) 10:22:05 POSIX 正規表現が使えるなら [[:alpha:]]{6} とか。 : 名無しさん@お腹いっぱい。 [sage] 2009/06/04(木) 10:29:36 POSIX文字クラスはロケール依存の罠があるから避けた方が無難と思う : 名無しさん@お腹いっぱい。 [sage] 2009/06/05(金) 02:21:52 POSIX 文字クラスって [[:isalpha:]] みたいのを言うんじゃなかったっけ? : 名無しさん@お腹いっぱい。 [sage] 2009/06/05(金) 02:23:34 おっとなんか馬鹿なこと書いてしまった。 [a-z] も locale でどうマッチするかかわったりするよ? : 名無しさん@お腹いっぱい。 [sage] 2009/06/13(土) 13:28:45 ホント? \w とかなら変わると思うけど、 [a-z] は locale に依らず ASCII コードの範囲になるのでは? : 名無しさん@お腹いっぱい。 [sage] 2009/06/17(水) 02:14:08 書き込み禁止されてた。 どのUNIXでもそうなるとは断言できないけど、locale が en_us.UTF-8 とかのときに a-z が aAbB….yYz な集合になるものもあるよ。 POSIX的には コード順だと定義はしてはいなかったはず。 : 名無しさん@お腹いっぱい。 [sage] 2009/06/17(水) 08:44:18 文字列の範囲はロケールに依存する。例えば、エストニア語のアルファベット では、s の後に z があり、その後は t、u、v、w、x、y と続くので、[a-z] で はすべての小文字のアルファベットにマッチしない : 名無しさん@お腹いっぱい。 [sage] 2009/06/22(月) 05:54:23 うふふ : 名無しさん@お腹いっぱい。 [sage] 2009/06/25(木) 21:28:07 それはlocaleの問題でもOSの問題でもないだろ 例えばlgrepはデフォルトがcase insensitiveだし : 名無しさん@お腹いっぱい。 [sage] 2009/06/26(金) 17:56:44 問題が理解できてないようだな。君は話に加わらなくて良いよ。 : 名無しさん@お腹いっぱい。 [sage] 2009/06/26(金) 18:09:55 それだけだとかわいそうなので補足すると、 が言ってるのは case sensitivity の問題じゃないよ。 のレスの「aAbB….yYz」をよーく目をこらしてみてごらん。 ロケールによってはこういう不思議現象が起こるのよという話。 : 名無しさん@お腹いっぱい。 [sage] 2009/07/13(月) 21:38:46 ジオ落ちててonigurumaのソースが落とせん。 だれかミラー的なもの知らない? : 名無しさん@お腹いっぱい。 [sage] 2009/07/13(月) 21:50:51 いや、あったは、ミラー。<mirrorservice.orgとか : 名無しさん@お腹いっぱい。 [sage] 2009/09/19(土) 19:50:17 ()内の、で区切られたものを 1(あああ、1) → 1(1、あああ) 2(ううう、3) → 2(3、ううう) 3(えええ、1) → 3(1、えええ) のように入れ替えたいです。 条件は ・括弧は半角全角どちらでも対応。出力はどちらかに統一する。 ・(あああ、いいい、ううう)のように3つ以上あるのは無視する それと、こうやってもうまくいかないのは何故でしょうか? sed -e 's/(/\(/g' -e 's/)/\)/g' -e 's/、/,/g' test.txt | sed 's/\(([^,)]*),([^,)]*)\)/(\\2、\\1)/g' : 名無しさん@お腹いっぱい。 [sage] 2009/09/19(土) 19:51:30 こうやれば望みどおりの結果は出たのですが、 汎用性が低いのでもっとちゃんとしたのを作るにはどうしたらいいですか? #!/bin/awk -f BEGIN { FS="((|)|\\(|\\)|、| | +)" } { {print $1"("$3"、"$2$4")";} } : 名無しさん@お腹いっぱい。 [sage] 2009/12/05(土) 13:45:25 あ : 名無しさん@お腹いっぱい。 [] 2010/06/02(水) 05:32:30 ほ : 名無しさん@お腹いっぱい。 [] 2010/06/02(水) 17:20:06 ttp://arrow3.way-nifty.com/shige/images_pc/RegExp.png ttp://www.codezine.jp/static/images/article/1655/config.jpg ttp://mckyblog.img.jugem.jp/20090724_436625.png ttp://www19.atpages.jp/imagelinkget/get.php?t=v&u=makotowatana.ld.infoseek.co.jp/VBScriptRegularExpressions.png ttp://makotowatana.ld.infoseek.co.jp/text.gif : 名無しさん@お腹いっぱい。 [] 2010/09/23(木) 21:58:59 行頭にある>以外の>を置換したいのですが、どのように記述できるでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2010/09/24(金) 11:09:22 ヘタレな処理ですみません。動けば正義。 echo '>1>2>3>4>5>' | perl -ne '/^(.)(.*)/; ($a,$b)=($1,$2); $b=~s/>/*/g; print "$a$b\n";' : 名無しさん@お腹いっぱい。 [sage] 2010/10/03(日) 22:07:49 行頭にもし「>」が複数有れば二ツ目以降を削除する処理と 「>」以外が一文字以上続いてから「>」が一文字以上出現する文字列を 「>」以外が一文字以上続いている部分に置換する。 以上。 : 名無しさん@お腹いっぱい。 [sage] 2010/10/10(日) 09:52:22 性器表現で書けよニダ : 名無しさん@お腹いっぱい。 [sage] 2010/10/11(月) 21:58:34 ^>>+とか[^>]+とか あえて書くことに意味は無いし、 削除や置換は正規表現では書けない。 文章の表面ではなく、コンテキストを嫁。 : 名無しさん@お腹いっぱい。 [sage] 2010/12/12(日) 10:48:21 /RegEx/ - 便利な正規表現、みんなで共有 ttp://regex.gkbr.me/ : 名無しさん@お腹いっぱい。 [] 2011/01/11(火) 08:29:20 EmacsとpTeXを使っています。 pTeXでは日本語の括弧はいわゆる全角で書かないときれいに出ないみたいなので、 「(日本語)」のような表現を一発で「(日本語)」のように変換したいたと思うのですが、 これはどう書けばいいのでしょうか。 (日本語abc)や(Abc日本語)や(Abc日[改行コード]本語)のようなものにも 対応しなければならないような気がします。(abc)のようなのはそのままにしておきたいです。 てことは、 「両端が()で、()のなかにmultibyte文字が1文字でも入っているもの、複数行にも マッチする」という条件でよさそうなのですが、どうでしょうか。 "([[:multibyte:]]+)"で(日本語)の形のやつまではわかったのですが、 その先に進めません。PerlのスクリプトでもOKですので教えてもらえないでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2011/01/11(火) 15:02:53 入れ子になった括弧には未対応。 (replace-regexp "(\\([^\\(]*[[:multibyte:]][^\\)]*\\))" "(\\1)") # pLaTex で otf 使えば大丈夫だったような? : 名無しさん@お腹いっぱい。 [sage] 2011/01/11(火) 17:55:06 ありがとうございます。うまく動くようです。 OTFパッケージの方は実験してみましたがやっぱり()と()は区別しているような・・・ : 名無しさん@お腹いっぱい。 [] 2011/03/12(土) 12:19:28.18 apacheのmod_rewriteでURLを書き換えたいと思っています。 以下が.htaccessのコードになります。 ------------------------------------------------------------------------- RewriteEngine On RewriteRule ^([a-z0-9_-]+).htm$ execute.php?id=$1 ------------------------------------------------------------------------- 例えば、” ttp://moge/test.htm ”にアクセスすると” ttp://moge/execute.php?id=test ”と同じようになるというものです。 ディレクトリにはexecute.phpの他にindex.htmを置きたいと思っているのですが、上のhtaccessを設置すると、” ttp://moge/execute.php?id=index ”に飛ばされてしまいます。そこで、正規表現で特定の単語(index)を除外するにはどうすればいいのでしょうか? ご回答お願いします。 : 名無しさん@お腹いっぱい。 [sage] 2011/03/12(土) 14:53:45.34 Rewriteが htmなら index.html ファイルにする : 776 [sage] 2011/03/12(土) 15:37:35.48 あ、なるほど 確かにそれでもいけますね さんくすです ちなみに正規表現で特定の単語だけ除外っていうのはできないのでしょうか?? : 名無しさん@お腹いっぱい。 [sage] 2011/03/16(水) 20:14:08.75 否定先読みでおk あとマルチ乙 : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 11:43:28.27 すっごく基本的なことで申し訳ないんだけど aaaを含んでいてbbbを含まない行 ってのはどう書くんですか。 : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 12:00:15.87 それは正規表現だけでやらなきゃだめなのかい? : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 12:06:43.95 grepでログの特定行を抽出したくて : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 12:20:13.45 grep -v : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 12:29:14.56 GNU grep で grep aaa logfile | grep -v bbb ってのじゃだめ? : 784 [sage] 2011/03/29(火) 12:30:38.86 かぶったか : 名無しさん@お腹いっぱい。 [sage] 2011/03/29(火) 12:47:45.98 ああ、そっか。-v ありがと : 名無しさん@お腹いっぱい。 [] 2011/04/08(金) 01:34:57.59 vimの置換で以下のようなデータを置換したいです hoge(半角空白*****)\tsage\t ↓ hoge\tsage\t :%s/ //g だとhogeが ho ge だったりもするので 半角空白が続く\tを\tにしたいです。 どなたかご教示お願いします : 名無しさん@お腹いっぱい。 [sage] 2011/04/08(金) 02:09:54.62 :%s/ \+\t/\t/g とか? 本当にやりたいのは gg=G とか Align じゃないの : 忍法帖【Lv=11,xxxPT】 [] 2011/06/22(水) 16:55:34.67 aからz、かつAからZ、かつ0から9、かつその他記号(!"#$...)を含ませたいです。 [a-z&&A-Z&&0-9&&[^a-z^A-Z^0-9]] とやってみたのですがうまく行きません。(´;ω;`) どう表現すればいいでしょう。 : 名無しさん@お腹いっぱい。 [sage] 2011/06/22(水) 17:10:25.90 . : 名無しさん@お腹いっぱい。 [sage] 2011/06/22(水) 17:38:34.78 むしろ含みたくない文字を列挙したほうが早いんじゃね? : 名無しさん@お腹いっぱい。 [sage] 2011/06/23(木) 00:03:09.64 それは印字可能な文字から空白を除いたものなんじゃあないのかい : 名無しさん@お腹いっぱい。 [sage] 2011/07/08(金) 22:03:29.79 肯定条件と否定条件、常にペアで考えたいところです : 名無しさん@お腹いっぱい。 [sage] 2011/08/03(水) 03:28:35.00 :%s/\(半角空白\**\)//g ・・・ではなくて、Excelでいう所のtrim関数みたいな動作か? : 名無しさん@お腹いっぱい。 [sage] 2012/03/07(水) 21:00:09.49 gsedをターミナルで実行したとき、 丸数字の1〜20が[\x{2460}-\x{2473}]でマッチせず 「無効な範囲の終端」というエラーメッセージが出ます。 何を間違えているのでしょうか。 : 名無しさん@お腹いっぱい。 [sage] 2012/03/07(水) 22:36:48.15 > :%s/ //g 当人がチャレンジした結果がこれだから、タブ区切りの各値をtrimしたいんだろうと思うよ。 > 半角空白が続く\tを\tにしたい ってことだからでいいと思う。でもの後半は違うと思う。 : 名無しさん@お腹いっぱい。 [sage] 2012/03/07(水) 22:41:28.98 このスレ最近見てたと思ってたのに、8月だと… : 名無しさん@お腹いっぱい。 [sage] 2012/03/08(木) 05:24:46.29 の自己レス よく解らないのだけど、コードでなくそのまんま@からS(文字化けしていたらごめんなさい) まで、1行ずつの置換行を書き並べたらうまくいきました。 コードだと1行ずつ書いてもダメでした。エラーは出なかったからコード間違えたかな。 : 名無しさん@お腹いっぱい。 [] 2012/05/27(日) 23:08:25.45 linuxのgrepでgreenとつく単語を検索したいのですが、どういう正規表現を使えばよいのでしょうか : 名無しさん@お腹いっぱい。 [sage] 2012/05/28(月) 08:03:03.12 くだらねえ質問はここに書き込め! Part 200 ttp://engawa.2ch.net/test/read.cgi/linux/1335349596/ : 名無しさん@お腹いっぱい。 [sage] 2012/11/13(火) 18:47:33.56 リンゴ 1個 ミカン 2個 イチゴ 1個 スイカ 1個 スイカ 3個 ナシ トマト トマト トマト パイナップル : アップミス失礼しました [sage] 2012/11/13(火) 18:51:10.04 リンゴ 1個 ミカン 2個 スイカ 1個 スイカ 3個 イチゴ 2個 トマト 1個 トマト 3個 トマト 5個 を リンゴ 1個 ミカン 2個 スイカ 1個 3個 イチゴ 2個 トマト 1個 3個 5個 のように整理したいとき、正規表現で実現可能ですか? : 名無しさん@お腹いっぱい。 [sage] 2012/11/13(火) 21:24:23.96 何言ってんだ。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/14(水) 02:50:13.58 例えば sed ttp://toro.2ch.net/test/read.cgi/unix/1085730992/l50 : 名無しさん@お腹いっぱい。 [sage] 2012/11/16(金) 20:13:34.67 リンゴ 1個 スイカ 1個 ミカン 2個 スイカ 3個 イチゴ 2個 元データがこうなってない前提ならできるかもしれない : 名無しさん@お腹いっぱい。 [sage] 2012/11/16(金) 21:56:43.28 なってても出来ないことはないと思える : 名無しさん@お腹いっぱい。 [sage] 2012/11/17(土) 00:18:53.21 いや、正規表現どうこうって話じゃないだろ : 名無しさん@お腹いっぱい。 [sage] 2012/11/17(土) 03:31:10.85 まあ、そうだね : 名無しさん@お腹いっぱい。 [sage] 2012/11/17(土) 15:01:28.93 出発点になるテキストが規則的であればあるほど作業が楽になる。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/17(土) 16:45:39.64 sedスレで聞いてないね。perlやawkなど、どこか他で見た? ってか、本人どうしたの? : 名無しさん@お腹いっぱい。 [sage] 2012/11/18(日) 02:35:29.83 釣りだったようだな。 : 802 [sage] 2012/11/20(火) 15:26:50.28 いろいろ研究中ですが、釣りじゃありませんw 他のスレにまで投稿すると、マルチで蹴られてしまうからです。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/20(火) 16:03:55.39 マルチは同じ話題が並行して進行するのが問題。 ちゃんと移動すればマルチじゃないよ。 : 名無しさん@お腹いっぱい。 [] 2012/11/20(火) 18:49:22.20 以下のような文章があったとします。 〜aaa〜bbbaaa〜bbbaaa〜bbb〜 (〜は文字数の定まっていない文字列を表しています。) ここから、それぞれ最初のaaa〜bbbだけを抽出、真ん中のaaa〜bbbだけを抽出、最後のaaa〜bbbだけをで抽出したい時、どう正規表現で表せばよいのでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2012/11/20(火) 20:13:44.36 sedじゃだめなのかよ : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 02:55:30.50 「aaa」と「bbb」を例えば「【」「】」に置き換えてみると楽かも。 【があって、】以外のものがあるかないかして、】があったとき が検索パターンってことになるよね。ここまでが正規表現。 その後は、1回目にマッチしたときだけ吐き出す、最後にマッチしたものだけ…… は、何を使うかで変わってくる。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 07:09:17.34 「【」「】」に置き換えるんじゃなく、「aaa」と「bbb」の例でお願いします。 「【」「】」みたいな1文字じゃなく、「aaa」「bbb」みたいな複数文字なので。 しかも、「aaa」と「bbb」の間に普通の文字としてa bもあります。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 08:20:17.05 こいつ、何もわかってない : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 10:34:37.69 perlの正規表現使わないと無理だと思うよ。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:10:04.60 こんな感じかな? aaa[^b]*\(b\{0,2\}[^b]\+\)*b\{0,2\}bbb : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:16:22.41 の直後なのにマルチ : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:18:53.62 移動してるからマルチじゃないだろ : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:27:34.16 もっとタイムリーに本人出てこないとダレるわ : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:41:33.62 ttp://toro.2ch.net/test/read.cgi/tech/1340383120/421 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:43:27.15 おお、なるほど。 そんなところにも正規表現スレあったのか。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 11:48:07.59 マルチか。もう知らん。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 19:22:47.43 別人だと言ってるけど、それにしては似すぎ : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 19:39:46.55 こっちの見て書いたんだろ。 別人だとしてもマルチと変わらんな。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 19:53:25.11 ここにもある。なんか、もうやだw シェルスクリプト総合 その21 ttp://toro.2ch.net/test/read.cgi/unix/1352973453/l50 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 19:55:53.48 というよりシェルのが大元なのか。まあ、移動すると書いてあるからいいか。 : 名無しさん@お腹いっぱい。 [sage] 2012/11/21(水) 23:32:17.64 こっちの奴は句読点付けてるのな : 名無しさん@お腹いっぱい。 [sage] 2012/11/22(木) 00:06:51.47 > シェルスクリプトスレより誘導されてきました って書いてあんじゃん。ってかなんでこっちのスレで話を続けてるのかがわからん。 マルチうざい放置でスルーしよ : 名無しさん@お腹いっぱい。 [sage] 2012/11/22(木) 00:32:49.10 どっちが偽物とか関係なく、向こうの正規表現スレだけで進行させときゃ済む話だしな : 名無しさん@お腹いっぱい。 [sage] 2013/03/08(金) 21:56:18.88 すみません (1) (2) (30) (50) (123) (256) こんな感じのデータを (001) (002) (030) (050) (123) (256) こんな感じで変換するのはどうしたらいいんでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2013/03/09(土) 00:11:09.75 sed -e 's/(\([0-9]\))/(00\1)/' -e 's/(\([0-9][0-9]\))/(0\1)/' : 名無しさん@お腹いっぱい。 [sage] 2013/03/09(土) 08:01:38.44 すみませんが詳しい方のみ回答をお願いします : 834 [sage] 2013/03/09(土) 08:24:40.01 うまくいきましたありがとうございました。"-e"でスクリプトを2つ記述すればよかったんですね なんか頭が固くて思いつきませんでした…。助かりました。 : 名無しさん@お腹いっぱい。 [sage] 2013/03/09(土) 11:33:06.26 パイプもあるでよ : 名無しさん@お腹いっぱい。 [sage] 2013/03/10(日) 04:11:12.59 , 二度とこのスレに来るな。(俺がでないのは命を懸けて誓う) : 名無しさん@お腹いっぱい。 [sage] 2013/03/10(日) 12:21:19.60 このスレに来るな。(キリッ 命を懸けて誓う(キリッ 2ちゃん初めてか? 肩の力抜けよ。 : 名無しさん@お腹いっぱい。 [sage] 2013/03/10(日) 15:01:39.61 そりゃではないだろ。 : 名無しさん@お腹いっぱい。 [sage] 2013/03/10(日) 18:41:45.07 しかしの悪態はへどがでる : 名無しさん@お腹いっぱい。 [sage] 2013/03/10(日) 19:19:40.33 836 はウニ板で普通に見かける煽りレスだろ : 名無しさん@お腹いっぱい。 [sage] 2013/03/12(火) 21:07:11.26 質問です 正規表現使うとだーって英文テキストの変換が出来るじゃないですか そこで各英単語の頭文字のみをわーって大文字に変換したいんです 出来ますの?勿論ググりましたが、当方馬鹿なのでわかりません サルでも分かるような回答を強く期待します 僕はこういう小バカにしたような書き方しか出来ませんが、凄く切実に知りたいです さぁどうぞ↓ : 名無しさん@お腹いっぱい。 [sage] 2013/03/12(火) 21:36:04.74 引用符の中の単語はどう扱いますか? ``internationalization'' 等の長い単語が改行処理で ``-'' を使用して 分割された場合はどう扱いますか? などなど, 例外事項が多々発生します. すべての例外事項を網羅した上で, 各条件の対応方法を明記した上で 再質問したください. : 名無しさん@お腹いっぱい。 [sage] 2013/03/12(火) 21:40:19.06 だけで答えられる方によるサルでも分かるような回答を強く期待します さぁどうぞ↓ : 名無しさん@お腹いっぱい。 [sage] 2013/03/12(火) 22:16:49.08 こいつネタであちこちに書いてるやつだから まともに相手してもムダだよ。 : 名無しさん@お腹いっぱい。 [sage] 2013/03/12(火) 23:24:14.34 > 正規表現使うとだーって英文テキストの変換が出来るじゃないですか いや? : 名無しさん@お腹いっぱい。 [sage] 2013/03/13(水) 04:58:06.84 大抵のアプリケーションにはデフォルトで付いてる機能だよな。 MS-Wordとかさw : 名無しさん@お腹いっぱい。 [sage] 2013/03/13(水) 08:04:10.12 横レス済まんが、仮にクォーテーションやハイホネーション無視でいいから 単語1文字目を大文字に、って要求だったら、あんた答えられるのかね? : 名無しさん@お腹いっぱい。 [sage] 2013/03/13(水) 09:38:14.58 いや それがなにか? : 名無しさん@お腹いっぱい。 [sage] 2013/06/14(金) 04:31:45.66 < じゃね? 単語の始まり : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN 何かネタないの? : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN 先日、他部署を交えて開かれた社内技術交換会でのこと。 先輩は自分が開発担当したあるソフトのコーディング中に思いついたという ある文字列処理のプログラミングについて得意気に解説し始めた。 話し始めてしばらくして、隣の部署の人が口をはさんだ。 「それ、正規表現使えば済む話ですよね。スクリプトならsedとかで、 C言語からならregex(3)の関数群呼べばいいし。ウチでも昔はそれ専用の 文字列処理をいちいちコーディングしてたこともありますが 今ではregex(3)ばかり使ってます。ところで今日のお話というのは、 regex(3)を改良する方法か何かですか?」 そのあと先輩の話は支離滅裂になり、何の技術交換会だったのか よく覚えていない… : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN 勉強会だったら別にいいじゃん 文字列処理に役立たなくてもコーディング技術の勉強になれば 正規表現のライブラリが使えるのと正規表現のロジックを編み出すのは全く別の話 なんで別の部署の奴は得意げなんだ? 正規表現の存在を知ってる俺カッケーってこと? : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN コピペニマジレスカコワルイ : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN ↓ヤンクがどうたら : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN コピペすなわちコピー&ペーストはWindoze用語。 UNIX(vi)ではヤンク&プットなのでヤンプと言う。 この用語を間違えて使用しているとドザと思われて馬鹿にされるので 気を付けるように。 : 名無しさん@お腹いっぱい。 [sage] 2013/07/15(月) NY:AN:NY.AN (´・ω・`)ノ ハーイ! : 名無しさん@お腹いっぱい。 [sage] 2013/08/30(金) NY:AN:NY.AN 家畜人ヤンプ : 【中吉】 [sage] 2013/09/01(日) 04:33:31.70 \(..*\) ←どうしたって顔文字に見えちゃうよねぇ : 名無しさん@お腹いっぱい。 [sage] 2013/09/01(日) 07:39:33.31 ホスト規制で使用する正規表現の「(、|、)」の使用法について質問です。 「tanaka.co.jp」「tanaka.ne.jp」の両方を規制したい場合 「\.tanaka.(co|ne).jp」であっていますでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2013/09/01(日) 07:59:41.15 それだと .tanakainenjp とかでもマッチしてしまいます : 名無しさん@お腹いっぱい。 [sage] 2013/09/01(日) 08:46:24.81 うしろ2つのピリオドもエスケープしろってこと。 : 名無しさん@お腹いっぱい。 [sage] 2013/09/01(日) 09:12:06.75 ありがとうございます! 「\.tanaka\.(co|ne)\.jp」ですね : 名無しさん@お腹いっぱい。 [sage] 2013/09/22(日) 06:34:10.28 そろそろ保守し続けないといけない? : 名無しさん@お腹いっぱい。 [sage] 2013/12/20(金) 05:42:21.79 見えちゃう、見えちゃう。って、あれ、自分で書いたんだったorz : 名無しさん@お腹いっぱい。 [sage] 2014/02/10(月) 17:15:58.93 そっか、保守必要なのか : 名無しさん@お腹いっぱい。 [sage] 2014/03/27(木) 02:42:30.48 てす : 名無しさん@お腹いっぱい。 [sage] 2014/03/27(木) 07:28:06.64 [test] 書きこみテスト 専用スレッド 12 [テスト] ttp://toro.2ch.net/test/read.cgi/unix/1382232233/ : 名無しさん@お腹いっぱい。 [sage] 2014/03/27(木) 07:58:50.65 「てす」は保守目的ジャマイカ? : 名無しさん@お腹いっぱい。 [sage] 2014/03/27(木) 09:03:14.23 保守目的なら「ほす」だろう。 : 名無しさん@お腹いっぱい。 [sage] 2014/03/27(木) 10:42:31.43 そうか、そうだな。許してほす : 名無しさん@お腹いっぱい。 [sage] 2014/05/31(土) 04:04:08.83 「正規表現」って変な名前だけど、定着してきたみたいだね? : 名無しさん@お腹いっぱい。 [sage] 2014/05/31(土) 05:56:12.12 定着も何もコンピュータ上で実現される以前からこの名前じゃねーの? : 名無しさん@お腹いっぱい。 [sage] 2014/05/31(土) 06:16:13.32 正規表現は誤訳が定着したもの。 「無理数」の誤訳と一緒。 : 名無しさん@お腹いっぱい。 [sage] 2014/05/31(土) 06:44:21.84 じゃあ、正しい訳語をどうぞ : 名無しさん@お腹いっぱい。 [sage] 2014/05/31(土) 06:57:48.92 さらに有理数なんて、無理数の無を有に変えた造語だしな。 : 【小吉】 [sage] 2014/06/01(日) 03:33:37.47 このスレの住人はどうやら5人のようだ : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 06:19:33.54 複素数も誤訳 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 09:45:27.06 正しい訳語を提示せずに誤訳誤訳叫ぶとか馬鹿にしか見えませんよ? : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:03:50.34 俺も居るよ : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:06:10.74 教えて欲しいなら教えてくださいといって聞かないと馬鹿にしか見えませんよ? : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:16:06.10 regular expression の正しい訳語を教えてください。 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:22:55.67 今ごろ聞いても馬鹿にしか見えませんよ? : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:36:00.41 今頃って最初から聞き返されてるじゃん何いってんのコイツ : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 12:59:00.89 「教えてくださいといって聞かないと」と言われてからそう聞き直しても馬鹿にしか見えませんよ? : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 13:44:27.82 こういう気持ち悪いのはだいたいFreeBSDユーザー : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 13:48:57.65 こういう気持ち悪い偏見を持ってるのはだいたいLinuxユーザー : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 14:14:59.03 で、適切な訳語ってなんなの? それとも、馬鹿に見えた相手には教えちゃ駄目な宗教にでも入信してるのかな。 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 14:28:45.17 こういう誤訳に反応するのはだいたいNetBSDユーザー : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 16:15:23.61 けっきょく正しい訳語言えないのね。 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 16:28:21.90 訳語は訳者の著作物だからなぁ。こんなところに書いて権利放棄したくないし。 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 16:48:08.97 どんだけ高尚な訳語が出てくるのが楽しみだから、論文でも書いてどっかで発表してからまた来てくれ : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 18:01:17.16 翻訳に関して世界一頑張ったのは日本人なんだって、どこかで読んだな。 : 名無しさん@お腹いっぱい。 [sage] 2014/06/01(日) 18:54:28.33 表意文字使ってるから頑張れば単語レベルで訳して意味を振れるんだよな。 カタカナ英語の乱用が白い目に見られるから訳せる分は訳そうとしたり。 中国とかはどうなんだろ? : 名無しさん@お腹いっぱい。 [sage] 2014/06/04(水) 00:29:16.48 レギュラーエスプレッソ : 名無しさん@お腹いっぱい。 [sage] 2014/06/08(日) 10:36:43.20 regular 正則 normal 正規 : 名無しさん@お腹いっぱい。 [sage] 2014/09/01(月) 20:44:42.15 正規表現は正則表達式。 正規分布は正態分布。 正規化は規範化。 非正規社員は臨時工。 : 名無しさん@お腹いっぱい。 [sage] 2014/09/25(木) 21:32:43.40 関西弁に反応する?正規表現 # 暇な人、できたら修正してやって下さい # chaika 等で利用する目的の為、JavaScript の正規表現です # spawned at 2ch.net/unix/正規表現 # ttp://peace.2ch.net/test/read.cgi/unix/1039165754/900 # news4vip/1395152022/ を参考にしました # Rev.001 (?: [^い]や| や(?:[でわろ]|ねん|んか|んけ|けど|ない|んけ)| るで|とるわ|[わが]な )w*[、。?!\s]| アホ|あほ|ホンマ|ほんま|アカン|あかん|ええで|なんでなん| ええ(?:やろ|やん|な|わ)| ちゃう(?:か|やん)| でき(:?ん|ひん)| (?:しとる|ない|よる)ねん| (?:変わ|分か?)らん| 言うたかて : 名無しさん@お腹いっぱい。 [] 2014/10/16(木) 20:19:07.96 世紀表現とワイルドガードの違いを一言でゆうと何になりますか? : 名無しさん@お腹いっぱい。 [sage] 2014/10/16(木) 22:11:18.07 聖飢魔II : 名無しさん@お腹いっぱい。 [] 2014/10/17(金) 05:10:53.04 双生児 : 名無しさん@お腹いっぱい。 [] 2014/12/07(日) 09:12:49.01 ネタない? : 名無しさん@お腹いっぱい。 [sage] 2015/01/16(金) 17:48:43.41 |tac|sed -n '/./,/.\n/p'|tac|sed -n '/./,/.\n/p' これは標準入力の中の上下の無駄な改行を全て削除します perlの正規表現でやるならどう書けばよろしいでしょうか? : 名無しさん@お腹いっぱい。 [sage] 2015/01/16(金) 18:15:48.11 ム板で聞いた方がいいんじゃね : 名無しさん@お腹いっぱい。 [sage] 2015/01/16(金) 23:09:51.63 (・∀・)アッテルカナ? (・∀・)もっと別の書き方も見てみたい perl -0777 -pe 's/\A\n+//s; s/\n+\Z/\n/s' : 名無しさん@お腹いっぱい。 [sage] 2015/01/17(土) 07:12:32.01 (・∀・) $ デナク /.\n/ デアル理由ガワカラナイケド、コウ解釈シテ、カイテミタ (標準入力の)複数行テキストの始まりと終わりの連続した改行を、削除する (・∀・) Unix板コソ正規表現ニフサワシイト思ッテイマス sed -e '1{:a;/^\n*$/{N;ba;};s/\n*//;};:b;/^\n*$/{${/^\n*$/d;};N;bb;}' (・∀・) オ!自分デモ使イソウナノデ、ホゾンシトコウ sed -e ' 1 { :loop1; /^\n*$/ { N; b loop1; }; s/\n*//; }; :loop2; /^\n*$/ { $ { /^\n*$/ d; }; N; b loop2; } ' (;・∀・) 間違ッテタラ、オシエテクレ : 名無しさん@お腹いっぱい。 [sage] 2015/01/17(土) 09:20:21.90 (・∀・) この部分が $ d; だと何故か動かなかったので (・∀・) あえて /^\n*$/ を入れてたけど、動くみたいなので訂正 $ { /^\n*$/ d; }; @@ -10,9 +10,7 @@ :loop2; /^\n*$/ { - $ { - /^\n*$/ d; - }; + $ d; N; b loop2; } (・∀・) url抜キデ、ブログニ貼ラナイデネ : 名無しさん@お腹いっぱい。 [sage] 2015/01/17(土) 15:54:44.86 perlって面倒くさいんだね。Nコマンドで最終行が無くなったりしないの? sedだったら、行頭と行末の間に何もない行は削除、という感じで /^$/d これだけなんだけど。 : 名無しさん@お腹いっぱい。 [sage] 2015/01/17(土) 19:19:41.25 (・∀・) 元々ノオ題ハコレ(先頭ノパイプハ除イタ) tac|sed -n '/./,/.\n/p'|tac|sed -n '/./,/.\n/p' (・∀・) 合ッテルカドウカ分カラナイケド、 (・∀・) tac デヒックリ返シタリスルノヲ止メ sed 一発ガ、コレ(修正前) sed -e '1{:a;/^\n*$/{N;ba;};s/\n*//;};:b;/^\n*$/{${/^\n*$/d;};N;bb;}' (・∀・) perl ダトコレ perl -0777 -pe 's/\A\n+//s; s/\n+\Z/\n/s' (´・ω・`) 空行削除ノ話? sed -e '/^$/d' : 名無しさん@お腹いっぱい。 [sage] 2015/01/18(日) 02:13:00.56 あ、ごめん、「無駄な改行」を「空白行」だと思い込んじゃったわ。 「無駄な改行」をスクリプトが判断してくれるの? あ、いやいや、わかんないことに首つっこむのは止めるわ。ごめんね。 : 名無しさん@お腹いっぱい。 [sage] 2015/01/18(日) 07:11:53.40 (・∀・) イエイエ。アリガチナ事 (・∀・) 所デ、書イテハイナカッタケド、一気ニ読ミ込ムナラ、perl 同様ナ書キ方モ出来ル sed -e ' :loop; $! { N; b loop; }; s/^\n*//; s/\n*$//; ' : 名無しさん@お腹いっぱい。 [sage] 2015/01/18(日) 21:21:15.59 Thanks to (・∀・) ありがとうが何日間か送れなくて申し訳なかったです : 名無しさん@お腹いっぱい。 [sage] 2015/01/19(月) 12:37:39.32 while (<>) { $myline .= $_; } $myline =~ s/\A\n+//mx; $myline =~ s/\n+\Z//mx; print $myline; perlはよく分からないけど \A と \Z で最初と最後にアンカーおろして \n+で指定すれば簡単か : 名無しさん@お腹いっぱい。 [] 2015/01/30(金) 07:35:17.36 \Zじゃなくて\zかな。\Aはあってる。 : 名無しさん@お腹いっぱい。 [sage] 2015/01/30(金) 10:29:28.40 無条件で、テキストの終わりの連続した改行を取り除けば良いという訳では無く text\n text\n \n \n \n とあれば、最後の3つの \n を取り除いて出力するのが、望ましい動作 一方で行末に\nが無いものに改行を付けてしまうのも、望ましくない ...と思う text\n text : 名無しさん@お腹いっぱい。 [sage] 2015/01/30(金) 12:13:26.39 s/\n+$/\n/ : 名無しさん@お腹いっぱい。 [sage] 2017/04/21(金) 08:12:15.25 strを含むがstringを含まない ^(?!string).*(?=str).+$ これ、先頭の^と最後の.+$が必要な理由をだれか教えてくだんそん。 : 名無しさん@お腹いっぱい。 [sage] 2017/04/23(日) 21:05:41.03 そもそもその正規表現の意味が違う気はするけど それは置いといて、^は行頭、$は行末 : 名無しさん@お腹いっぱい。 [sage] 2017/07/20(木) 07:30:01.68 Jane Styleで。。。はOKで。。をNGにしたいんですが、教えてください。 : 名無しさん@お腹いっぱい。 [sage] 2017/07/20(木) 09:34:21.63 (?<!。)。。(?!。) 知らないけど : 921 [sage] 2017/07/20(木) 13:11:41.43 ありがとう。所詮俺には無理なことも分かりました。 : 名無しさん@お腹いっぱい。 [sage] 2017/08/01(火) 17:01:00.66 ^/FIRST/(.*)/SAMPLE$ この正規表現がどんな意味しているか知りたいです。 これってどんなURLがマッチしますか? : 名無しさん@お腹いっぱい。 [sage] 2017/08/01(火) 17:34:05.56 /FIRST//SAMPLE /FIRST/あ,い.う;え:お/SAMPLE /FIRST/くぁwせdrftgyふじこlp/SAMPLE () がメタ文字なら : 名無しさん@お腹いっぱい。 [sage] 2017/08/01(火) 17:50:44.54 nginxのコンフィグの話ならnginxスレで続けた方がいいよ : 924 [sage] 2017/08/01(火) 21:05:47.63 ありがとうございます。 FIRSTとSAMPLEの間(一つのディレクトリ)は改行コード以外ならば全部マッチするんですね。 ()で囲むと後方参照…、 /で囲まれてSAMPLEで終わって参照される? これがわからなかったんです。 : 名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 06:09:37.08 ABCとDEF という単語を両方含むレスをNGにする事はできますか? ABCだけが含まれるレスとDEFだけが含まれるレスはNGにせず、両方含まれる場合だけNGにしたいです : 名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 09:49:56.44 ABC.*DEF DEF.*ABC とかそういう話? : 名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 19:10:16.65 マルチ注意 : 名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 21:11:53.55 そういうときはどことのマルチか書かないと ttp://fate.2ch.net/test/read.cgi/ios/1494717956/150 : 名無しさん@お腹いっぱい。 [sage] 2017/09/06(水) 23:54:46.66 純粋になぜ複数のスレに同じ内容のレスをしたらダメなのかわからないのですがマナー違反なのですか? 荒らし行為がダメなのはわかりますけどただの質問ですし誰も傷つきませんよね? またマルチですが・・と前置きすれば許されるものなのでしょうか : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 03:43:15.10 お前は時間が節約できる、よりいいレス集まるとでも思ってるかも知らんが、相手のことを何も考えないクズ : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 04:23:07.36 自分も見かけた事あるから気持ちはわかるよ べつになんとも思わなかった 荒らしはむかつくけど 知りたい事があるなら合理的な行動だと思うしべつに同じ内容を連投する訳でもないからなんとも思わない : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 04:23:31.36 腹が立ったの? いらついたの? : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 04:24:16.00 同じ人がレスしたんだなぁって思うだけ 自分がもし答えられたらどれかのスレで答えるただそれだけ : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 04:26:07.09 明らかに迷惑なものとそうでないものとわかるだろw : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 07:53:41.36 板やスレを分けている理由に反する。全部集約して一つのスレで良いだろう、それを許容するなら。 それに君は自分のことだけ考えてそう思ったのかもしれんが同じ事を考えた一万人が同じ事をしたら 答えのつかない同じ質問やバリエーションの異なる答えのついた質問があっちこっちに大量投下されることになる。 それって質問を装った荒しだよね。 : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 08:00:25.53 まぁ君の意見はわかったよ でも俺は効率を重視するんでなんと思われてもマルチやりますよ まぁ滅多にやる機会はないけどね 今までま3回くらいしかやった事ない なぜならそこまでして知りたい事(調べても答えが見つからない事)がなかなかないからね ちなみに前回もマルチ云々言われたのを覚えてるよ ググってすぐにわかる程度の事なら マルチしないよ : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 08:00:57.11 そんなにイヤな気持ちになるのが俺は理解できないけどねぇ : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 08:01:44.47 正規表現関連のスレ三つに同じ質問しただけなのに敏感すぎだろ : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 08:22:15.56 好きにすれば良いと思うよ。 俺は君が質問したから答えただけでそれ以上の話ではない。 その質問ここでする意味あったのかって気はするけど 早く答えがほしかったんだよね。ググったくらいで見つからないから質問したんだよね。 良かったじゃないか。何も問題は無いね。 : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 10:54:38.94 マルチする奴はクズ はっきりわかんだね : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 13:19:59.20 許容派が意外に多いのかと思いきや、3連4連レスしてるだけかよ : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 15:09:36.32 気に入らないなら無視すればいいのよ。 : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 16:12:52.13 まだ言ってるのかよw どうでもいいw : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 17:20:51.57 どうでもいいならスルーしとけよw バレバレ : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 17:42:26.53 マルチ云々はどうでもいいけど まだ言ってることはどうでも良くない だからレスした : 名無しさん@お腹いっぱい。 [sage] 2017/09/07(木) 18:42:02.37 掲示板でマルチポストはなぜいけないの? ttp://www.ml-info.com/weekly/archives/2009/091024o.html : 名無しさん@お腹いっぱい。 [] 2017/09/07(木) 18:44:09.02 まぁ今は2ちゃんの人口少なくてレスもこないからね : 名無しさん@お腹いっぱい。 [] 2017/12/29(金) 07:21:04.18 誰でも簡単にパソコン1台で稼げる方法など 参考までに、 ⇒ 『宮本のゴウリエセレレ』 というブログで見ることができるらしいです。 グーグル検索⇒『宮本のゴウリエセレレ』 SALKY13WAM
凡例:
レス番
100 (赤) → 2つ以上レスが付いている
100 (紫) → 1つ以上レスが付いている
名前
名無しさん (青) → sage のレス
名無しさん (緑) → age のレス
ID
ID:xxxxxxx (赤) → 発言が3つ以上のID
ID:xxxxxxx (青) → 発言が2つ以上のID
このページは2ch勢いランキング が作成したアーカイブです。削除についてはこちら 。