統計学なんでもスレッド　13

： １３２人目の素数さん [] 2011/02/11(金) 01:51:36

2010.9上旬のkamomeサーバ霧散スレッド全損事件から５ヶ月、
運営陣から復旧策の音沙汰皆無のため、後続スレを建てました。
引き続き、質問等どうぞ。

前スレ
統計学なんでもスレッド12
ttp://kamome.2ch.net/test/read.cgi/math/1283521346/

： １３２人目の素数さん [] 2011/02/11(金) 01:55:20

： １３２人目の素数さん [] 2011/02/11(金) 02:07:28

関連スレ１　現行数学板
統計ソフトSTATAの部屋 Ver.2
ttp://kamome.2ch.net/test/read.cgi/math/1284083650/
【R言語】統計解析フリーソフトＲ第４章【GNU R】
ttp://kamome.2ch.net/test/read.cgi/math/1294561909/

関連スレ２　2010.9以前の数学板
統計学なんて数学じゃないだろ
ttp://kamome.2ch.net/test/read.cgi/math/1173876727/
=統計解析= SASプログラミング
ttp://science6.2ch.net/test/read.cgi/math/1184762259/
統計解析フリーソフト　Ｒ　【第３章】
ttp://kamome.2ch.net/test/read.cgi/math/1224142396/

： １３２人目の素数さん [] 2011/02/11(金) 02:09:34

関連スレ３　他板　
統計学
ttp://kamome.2ch.net/test/read.cgi/sociology/982489314/
経済学で使う統計学スレッド
ttp://kamome.2ch.net/test/read.cgi/economics/1094012265/
生物学での統計学スレ
ttp://kamome.2ch.net/test/read.cgi/life/1127772845/
◆統計学について語るスレ
ttp://kamome.2ch.net/test/read.cgi/sim/1012828891/
統計・解析ソフトについて
ttp://hibari.2ch.net/test/read.cgi/bsoft/1012298063/

： １３２人目の素数さん [] 2011/02/11(金) 02:11:49

テンプレ１
●学校の宿題の丸投げはやめましょう。
●質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
●荒らしは基本的にスルーでお願いします。

： １３２人目の素数さん [sage] 2011/02/11(金) 02:24:20

>>1

前スレのログから察するに、前スレは2010/09/07(火)の午後に20番レスまでで、
消失全損したようです。

： １３２人目の素数さん [] 2011/02/12(土) 08:31:22

>>987

>最近はデータ数がバカみたいに多く集まることが多いので、統計的検定は無意味だと聞いたんですがホント？
>たしかにnが万単位あれば僅かな平均値差でもバリバリ有意になっちまいますね・・・・・
n=10000ケのデータに対し、統計的検定を行うことってあるのかな？
10000ケの抜取標本平均や標本不偏標準偏差の記述統計で、十分なのでは？

： １３２人目の素数さん [] 2011/02/12(土) 22:16:31

>>987

>>7

目的がわからないので、検定は無意味か？と聞かれても
応えられないと思いますよ。

： １３２人目の素数さん [sage] 2011/02/13(日) 00:44:35

>>7

消失スレに書いたけど円周率が乱数かという検定ならデータが多くても行う。

>>8

が言うように目的次第。

： １３２人目の素数さん [] 2011/02/13(日) 02:37:49

フリードマン検定は1要因の対応ある条件の比較のみに用いられるのですか？
2要因について用いられることはありませんか？

： １３２人目の素数さん [sage] 2011/02/14(月) 05:53:58

質問です。とあるサイトからの引用なんですが、

＞あたりくじが１つ、ハズレくじが９つのくじびきを１０人で引く場合、
＞数学でいえば、何番目にくじを引いても当たりくじを引ける確率は同じだが、
＞統計学でいえば、実際に２千回、５千回、１万回試行をすると実は６番目が一番当たりくじを引きやすいという結果が得られる。

2行目の当りくじの確率は理解できるんですが、
3行目の6番目云々が良く理解できません。
実際の試行回数と偏差とかのデータは出してないんで、主張が正しいかどうかはわからないんですが、ありえるんですかね？

一応自分で考えたところでは、仮に1万回試行として、
10分の１の1万回試行、9分の１の（1万ー10分の１の当り回数）試行、・・・・（1万ー10分の１の当り回数ー9分の１の当り回数ー・・・・2分の1の当り回数）
の当り数の分布の比較ということになると思うのですが、
回数が安定するかどうかに違いはあっても、くじの引ける確率自体は同じである以上、統計上6番目が一番出やすいということは無いと思うのですが。

どうなんでしょう？

： １３２人目の素数さん [sage] 2011/02/14(月) 08:38:21

>>11

1から10であたりがでるので、期待値は5.5。
そのことを、誰があたりを引くかと間違えて、6と書いてるのかな。

シミュレーションするなら、一様分布を前提に、毎回10人に順に引かせて誰が当たったかの結果をだして、その分布を確認だね。

： １３２人目の素数さん [] 2011/02/14(月) 13:38:02

回帰統計
重相関 R 0.152278611
重決定 R2 0.023188775
補正 R2 -0.116355685
標準誤差 2.206272678
観測数 17

分散分析表
自由度変動分散観測された分散比有意 F
回帰 2 1.617758084 0.808879042 0.166174817 0.848544242
残差 14 68.1469478 4.867639128
合計 16 69.76470588

係数標準誤差 t P-値下限 95% 上限 95% 下限 95.0% 上限 95.0%
切片 10.4845444 6.609867644 1.586195816 0.135017062 -3.692211688 24.66130049 -3.692211688 24.66130049
52 -0.051129843 0.095080104 -0.537755434 0.599190715 -0.255056384 0.152796698 -0.255056384 0.152796698
31 -0.000651974 0.111476851 -0.00584851 0.995416112 -0.239746038 0.238442091 -0.239746038 0.238442091

重回帰分析なんだけど
これって有意差はなしってことでおｋ？

： １３２人目の素数さん [sage] 2011/02/14(月) 19:30:28

>>11

>>12

だけど、1000回のシミュレーションを5回してみた。
念のため分散分析もしてみたけど、結論としては6が出やすい
ということはないです。
まあ、以下の結果を見ると、6が多めに出てる場合があるので、
それを見て、統計学的に6が出ると判断しちゃったのでしょう。

シミュレーション結果（試行10,000回）

非復元抽出で当たりの位置を記録

01____989___1001___1027___1038___1026
02___1046____991___1016____994___1006
03____934____980___1020____999____966
04___1015___1001____978____996___1004
05___1010___1016____969____985___1001
06___1001___1053___1000___1065____955
07____993___1011____979____935___1058
08____949___1002____981___1031___1007
09___1034____950____975____978____969
10___1029____995___1055____979___1008
sum_10000__10000__10000__10000__10000

： １３２人目の素数さん [sage] 2011/02/14(月) 19:31:31

>>14

10000回のを5回ね。ｗ

： １３２人目の素数さん [] 2011/02/14(月) 21:07:47

>>13

はあ？有意差？
ワロスｗ

： １３２人目の素数さん [sage] 2011/02/14(月) 21:54:40

>>16

考えられるのは、ダミーとかを使って、係数が有意に影響するかを確かめてる可能性。

まあ、EXCELの結果をそのまま貼ってるのを見ても、ほうっておくのがいいんじゃないかな。

： １３２人目の素数さん [sage] 2011/02/15(火) 00:05:10

>>3

>>4

関連スレ２　2010.9以前の数学板
【統計学】統計的仮説検定！！
ttp://science6.2ch.net/test/read.cgi/math/1201535084/

関連スレ３　他板
統計ソフト統合スレッド－SPSS・SAS以外
ttp://yasai.2ch.net/test/read.cgi/psycho/1012801769/
SASスレ
ttp://yasai.2ch.net/test/read.cgi/psycho/1012738237/
SPSSスレ
ttp://yasai.2ch.net/test/read.cgi/psycho/1012388599/
心理統計スレッド
ttp://yasai.2ch.net/test/read.cgi/psycho/975992250/

： １３２人目の素数さん [] 2011/02/16(水) 01:27:55

aとbがCに及ぼす影響を調べるためにはどの分析方法が最も適切でしょうか
t検定も分散分析も違うような気がするのですが…
ちなみにaとbは不変と可変、のように対になる変数です
よろしくお願いします

： １３２人目の素数さん [] 2011/02/16(水) 10:35:21

不変と可変って何？

： １３２人目の素数さん [sage] 2011/02/16(水) 22:35:17

>>19

Cが量的変数なら、重回帰分析か数量化Ⅰ類か実験計画法を使うのが普通だが。
「aとbは不変と可変」って、定数と変数ということですか？

： 11 [sage] 2011/02/16(水) 22:53:01

>>14

レスありがとうございます。
わざわざ時間かけてもらってすいません。

結果を見ても、差は誤差と考えるのが妥当ですね。
すっきりしました。

： １３２人目の素数さん [] 2011/02/17(木) 11:25:01

以下の四つのジャーナルの内、最もレスポンスが早いのはどれでしょうか？
また、ジャーナルの評価も聞かせて下さい。

・日本統計学会誌(英文)
・Communications in statistics
・Statistica Sinica
・Annals of institute of statistical mathematics

： １３２人目の素数さん [] 2011/02/17(木) 23:13:28

全データが与えられてるのを度数分布標作って平均値などを求めたんですが間違いになりますか？

： １３２人目の素数さん [] 2011/02/18(金) 16:33:21

>>23

投稿の内容とか、そのとき選ばれたレフェリーによっても全然違うから、
基本的には、レスポンスが早いかどうか全くわからないと言っていい。

聞いた話とか、おれやおれの友人が投稿した感じでは以下のように思う。

（おれは一度、日本統計学会誌で3ヶ月放置されたことがあるけどね）

・日本統計学会誌(英文)＝二ヶ月以内ぐらいには返事があるはず。
・Communications in statistics＝まあまあ早い。一ヶ月ぐらい？
・Statistica Sinica　＝早い。リジェクトの場合４，５日で返事が来ることも。
・Annals of institute of statistical mathematics ＝むちゃ遅いらしい。半年？

： １３２人目の素数さん [] 2011/02/18(金) 19:11:13

>>24

その「全データ」というのは母集団のこと？
つまり分析したい対象ということ？
それとも何かの標本？

： １３２人目の素数さん [sage] 2011/02/18(金) 21:22:50

統計学では高校数学のどの知識が必要ですか？

： １３２人目の素数さん [] 2011/02/19(土) 20:54:07.72

>>27

高校の教科書を見直してみた。
どこまでやりたいかによるけど、
初等幾何以外はほとんど必要だと思う。

： １３２人目の素数さん [] 2011/02/19(土) 22:13:05.42

>>27

ある程度きちんとやるなら、微積分の知識がいる。
統計的に分析する時に確率の知識が必要で、確率は面積なので積分がいる。
統計的分析をするためには微分もいる。

複数の変数を分析するには、線形代数（行列）の知識がいる。

ただ、EXCELとかで結果だけだせればよくて、手法はそれほど細かく
わからなくても、とりあえず分析したいだけなら、数学というよりも
常識があればＯＫ。

： １３２人目の素数さん [] 2011/02/20(日) 00:00:50.89

統計なんてバカのやること
高校生レベルで十分

： １３２人目の素数さん [sage] 2011/02/20(日) 00:15:42.89

　　　　　　　　　　　　　　　　　　　 |
　　　　　　　　　　　　　　　　　　　 |
　　　　　 ∩＿＿＿∩　　　　　　　　　 |
　　　　　 | ノ　 _,　　,_ ヽ　　　　　　（（　 |　ﾌﾟﾗﾌﾟﾗ
　　　　 /　　●　　　● |　　　　　　　　　(=)
　　　　 |　　　　( _●_)　ミ　＿　(⌒)　　J　　））
　　　　彡､　　　|∪|　ノ
⊂⌒ヽ　/　　　ヽノ　ヽ /⌒つ
　＼　ヽ　 /　　　　　ヽ　/
　　　＼_,,ノ　　　　　　|､＿ノ

： １３２人目の素数さん [] 2011/02/20(日) 04:10:26.79

実務で統計やってる人って何やってるかはわかんなくてただブラックボックス的にやってんの？

： １３２人目の素数さん [] 2011/02/20(日) 04:50:53.96

実務家で統計やってる人は、
ほとんどブラックボックスだね。
アフォばっかり。
学者は狭い範囲でいろいろやって喜んでいるだけ。

広く深く、しかも実践的なことが出来る人は
ごく少数しかいない。
おれからしたら日本には30人ぐらいしかいない。

： １３２人目の素数さん [] 2011/02/20(日) 20:44:28.90

複数の映像を見せて「どちらが迫力があったか」「どちらが爽快感があったか」などの質問に5段階で回答してもらったのですが
標本数が少なくp<0.1でも差が出ません
何とかどちらかが良いという結果を出したいのですが
このようなアンケート調査の場合どの程度まで有意水準をあげてもよいのでしょうか？

： １３２人目の素数さん [sage] 2011/02/20(日) 23:53:00.33

どこまででも行けばいい
信じる人が減るだけかな

： １３２人目の素数さん [sage] 2011/02/21(月) 01:24:13.03

>>34

どんな検定したのか分からないけど0.1より上げるのはないな。
本当には差があると思ってるんだったら検定法を変えると差が出るかもしれん。

： １３２人目の素数さん [] 2011/02/22(火) 16:13:03.01

45点満点のテストで平均点22点標準偏差6のとき
36点とった場合、偏差値はいくつになるのか、出現率（1000人中での順位）という
のはどれぐらいになるのでしょうか？

： １３２人目の素数さん [sage] 2011/02/22(火) 17:21:31.71

偏差値：50+10*(36-22)/6=73.333...
出現率の定義はよくわからないが、1000中での順位というのであれば、
正規分布で、x>2.333...の面積は、0.009815...。1000倍して切り上げし、10位と言うのが妥当だろう。

： １３２人目の素数さん [] 2011/02/22(火) 23:17:30.51

ありがとうございます。
偏差値73の成績と偏差値65の成績の二つの試験の合計での
出現率や総合偏差値というのは推計できるのでしょうか？

： １３２人目の素数さん [sage] 2011/02/23(水) 01:34:25.91

>>39

>>38

ではないが、複数の変数（複数の試験の結果）を合わせた分布を
計算するのには、

>>39

の情報だけではできない。

試験Ａの成績がいい人が、試験Ｂの成績もいいという関係があるのか、
逆の関係があるのか、その関係はどれくらいなのか、両方の試験の結果
にはあまり関係が無いのか、といった情報がないと、分布の形が特定
できないので計算もできない。

単純に二つの点数を足したもので、総合の偏差値を計算することは可能
なので、それが簡単かもしれないけど、二つの試験の総合点の標準偏差
の数値なんて持ってないよね。

ちなみに、偏差値73と65における順位と、合計したものの順位は異なる。
偏差値73と65の順位というのは、73よりも成績がよく、65よりもいいと
いう両方の条件を満たす人。
総合した場合には、どちらかが下回っている人が総合点で上に来ることが
あるので結果が違ってくる。

： １３２人目の素数さん [sage] 2011/02/23(水) 02:55:34.10

>>39

>>40

　の書いていることは、

数学と英語の試験があって、
１）片方の成績がいいともう片方の成績もいいとすると、英語で高得点を
取った人は数学でも高得点を取ることになる。

２）英語と数学の成績にはマイナスの相関があると、英語の成績がいい人で
数学の成績のいい人は少なくなる。

つまり、１）と２）を比べると零点から200点の間に、１）の方が広く分布
してて、２）の方が平均点の所に多く分布していることになる。
そのため、１）と２）では１）の方が分散が大きくなる。

あと、３）として、両方の試験にまったく相関が無い場合。
これは、英語で10点取ってる人たちと、90点取ってる人たちを比べると、
数学の成績の分布が一緒だってこと。
どちらにも、数学で10点の人とか90点の人が、同じようにいる状況。

二つの試験の点数の関係で結果が変わるので、その情報が無いと、計算が
できない。

： １３２人目の素数さん [sage] 2011/02/23(水) 09:13:04.87

世界最速２バスの曲　DIMMU BORGIRの"The Chosen Legacy"
290～300BPMの16ビート
外部リンク

ttp://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1347376823
外部リンク

ttp://www.youtube.com/watch?v=JEj2hXC3TA4
DIMMU BORGIRの"The Chosen Legacy
外部リンク

ttp://www.youtube.com/watch?v=afzN_Ab2BhI

ドリームシアター６４ビート　　　150BPMの64ビート
外部リンク

ttp://www.youtube.com/watch?v=KveVL5IN9eY

64ビートとは世界最速ドラマー「ヘルハマー」の２倍のスピードとなる事が判明した！

： １３２人目の素数さん [] 2011/02/23(水) 10:59:51.24

39です。>4041ありがとうございます。
正規分布の面積で順位を算出することがわかりました。二つの試験の
場合は相関関係がわからないとだめなようですね。ありがとうございます。

： １３２人目の素数さん [] 2011/02/25(金) 18:17:46.83

質問します。
glmを使い，説明変数の数を変えて複数のモデルを作りました。
複数モデルの中から最もあてはまりの良いものを知りたいので
AICを比較しようと考えたのですが，AICがInfとなり，表示してくれませんでした。
使っているソフトはRです。
AICが非常に小さいくて（おそらく２以下？）表示されないと考えているのですが，
これでは比較できません。
対処法をご存じの方がいらっしゃいましたら，教えていただきたく存じます。

： １３２人目の素数さん [sage] 2011/02/26(土) 00:04:38.76

>>44

小さいから表示されないということはありません。
Infですから無限大なのでしょう。
ｇｌｍ後の出力で係数は表示されているのにAICのところのみInfと
なるということですね？他のモデルではAICが表示されるのなら
少なくともそのモデルはだめという結論でよいように思います。
AICを小さくするモデルを探索しているのですから。

： １３２人目の素数さん [] 2011/02/27(日) 23:33:43.39

ARモデルで共分散定常性が成り立たないときはOLSで推計をするのは
妥当ではないと本に書いてありましたが理由は書かれていませんでした。
どなたか理由を教えていただけないでしょうか。

： １３２人目の素数さん [sage] 2011/03/01(火) 00:40:38.30

>>46

定常でない時系列でARモデルを当てはめるってそもそもどういう仮定で
どうやって解くのだろう？その本にはそもそもそういうときにどうすれば
いいのかも書かれていないんですよね？それならば理由は仮定を満たして
いないからということでは。

： １３２人目の素数さん [] 2011/03/06(日) 18:40:50.90

証明問題をやってて
具体的にiが1～ｎまでみたいに決まってなくて
集合Aの範囲内のものを全て足し合わせるってことを書きたいんだけど

ΣAf(x)　（Aは下に小さく書く）

って書き方でいいのかな？
それとも何か正しい書き方ってある？

： １３２人目の素数さん [] 2011/03/06(日) 23:01:08.91

統計学会春季大会（立教大学）乙！
会場がちょいと寒かった。
暖房いれるとみんな寝ちゃうから？

： １３２人目の素数さん [sage] 2011/03/07(月) 00:27:45.84

>>48

なんでここで訊いてるのか分からないが、TeXで書くと
\sum_{x \in A} f(x)
となるのでは？（\inは集合の含まれるの記号）

： １３２人目の素数さん [sage] 2011/03/17(木) 00:25:55.53

>>49

これですね。興味深い発表は、どれでしたか？
第5回日本統計学会　春季集会
日　時：2011年3月6日 (日) 10:00 ～ 17:30
場　所：立教大学 (東京都豊島区西池袋3-34-1)
外部リンク

ttp://www.jss.gr.jp/ja/convention/spring/05/JSSspring2011_program.html

： １３２人目の素数さん [] 2011/03/18(金) 07:53:20.20

質問します。
教科書に、大標本と小標本なる用語があるのですが、定義が載って
おりません。標本数何ケが境目なのですか？

： １３２人目の素数さん [sage] 2011/03/22(火) 01:36:17.66

明確な境目はないですよ。
10だと確かに少ないし、100だと多い方ですが、
どんな分析をどんな精度でするのかにも依存しますし。

： １３２人目の素数さん [] 2011/03/29(火) 15:50:34.70

偏差値って正規分布専用の指標？

： １３２人目の素数さん [sage] 2011/03/29(火) 18:09:45.99

>>54

逆に聞くけど、SDって正規分布専用？

： １３２人目の素数さん [] 2011/03/29(火) 23:34:19.30

日本統計学会、・・・・プッ

： １３２人目の素数さん [sage] 2011/04/01(金) 22:41:27.66

すみません
試行Ａ　　　成功
２９　　　　　　　５

試行Ｂ　　　成功
３６　　　　　　　９

の二つの試行は違うと言えるのかどうかの検定ってどういう検定でできますか？

：５２ [] 2011/04/02(土) 03:27:09.67

>>53

応答ありがとうございます。
精度に依存するというのは、設定する許容誤差に連動するということですね。
許容誤差をαとすると、境目の標本数はどのような式で計算するのでしょうか？

：５７ [sage] 2011/04/02(土) 11:02:17.11

誰か教えてくれ・・・

： １３２人目の素数さん [] 2011/04/02(土) 14:22:25.84

極限の問題だと思います。
このような問題をやったことが無いので、出来るだけ詳しい説明をしていただけると嬉しいです。
①lim(θ→0)　sin5θ/sin2θ
②lim(u→0)　u・log{1+(3/u)}
③lim(x→-∞)　x+1/{√(x^2+x+1)-x}

宜しくお願いします。

： １３２人目の素数さん [] 2011/04/02(土) 14:24:01.03

↑数学何でもスレッドと勘違いしました。
申し訳ないです><。

： １３２人目の素数さん [sage] 2011/04/02(土) 14:36:40.83

>>58

無いよ。

例えば、標準正規分布を用いた検定と、t分布を用いた検定を考える。

この時、サンプルが30くらいあれば、どちらの方法でも目的としてる精度で分析できるなら、簡単な方を使う。

それと同じように考えればいい。

ただし、検定によっては、大標本の特性は数学的にもとまっていても、小標本の特性はわかってない時がある。
そんなときは、シミュレーションでサンプルサイズによる特性を調べて、それを使う。それが無理なら、とりあえず大標本の結果を利用する。

： １３２人目の素数さん [sage] 2011/04/02(土) 16:44:56.13

>>57

分割表の独立性の検定

： １３２人目の素数さん [sage] 2011/04/02(土) 17:21:11.30

>>62

挙げている例が説明と合ってないよ。
正規分布を用いた検定とt分布を用いた検定ではt分布の方が常に精度がよい。
しかし、たとえば標本の大きさが100ぐらいになるとその差は大してないので
正規分布を用いた検定でよいと考えたりする。
この場合明確に精度の差を考えたら切り替え基準も作れなくはない。
ただ精度の差は応用で違うし、主観的にもなるのでそういう議論をすることは
ほとんどない。

一般的にはこういうように説明できる方が珍しく小標本の方法の特性が
分かっていなかったり単純に比べられなかったりする場合が多いことは確か。

： １３２人目の素数さん [sage] 2011/04/02(土) 18:52:30.98

>>63

ありがとうございます
たいして違いないみたいですね。

： １３２人目の素数さん [sage] 2011/04/04(月) 14:54:44.08

>>55

答えはNOという事ですね
あり＾＾

： １３２人目の素数さん [sage] 2011/04/06(水) 14:29:57.53

もし、真剣にロト６を統計したら一番期待が持てるのってどれなんだろうか？
過去３０回分とかで計算したことある人は結構いそうだけど過去全部で計算したことある人っているか？

： １３２人目の素数さん [sage] 2011/04/06(水) 23:18:02.98

どれとは？一番期待値が高くなる組み合わせってこと？
過去全部でもすべての組み合わせが出ているわけではないので
一番は決められないのでは？

： １３２人目の素数さん [sage] 2011/04/07(木) 19:24:30.11

さらに言うと第１３８回から使う玉が変更されました
さらに言うとA～Jセットまでがあって
頻度調整の為に恣意的に使われるセットが替わります
僕はデータベースにできる限りの情報を記録しています

： １３２人目の素数さん [sage] 2011/04/07(木) 22:08:27.61

それってどのセットを使うのが事前には公表されないでしょ？
どのセットを使うかも予測するってこと？
セットを変えるのは本当に頻度調整のためなの？
（頻度調整となると出る玉に偏りがあることになるが、
それを立証できるの？）

： １３２人目の素数さん [sage] 2011/04/07(木) 23:29:51.04

１レスに質問は一つにして下さい

： １３２人目の素数さん [sage] 2011/04/08(金) 14:00:17.39

皆は学部どこ？
俺は経済学部なんだけど理学部数学科ばっかりか？

： １３２人目の素数さん [] 2011/04/09(土) 14:30:26.09

統計解析についての質問。
企業がエクセルを導入したことによって、どのような統計解析が可能になったのか？
質問が雑であまりうまくまとめられてないので、すいません。
友人から「この質問を解答してくれ」と頼まれたので、宜しくお願いします。

： １３２人目の素数さん [] 2011/04/09(土) 17:34:27.66

お断りします。

： １３２人目の素数さん [sage] 2011/04/11(月) 19:11:17.73

>>73

エクセルを導入せずとも、実行可能な統計解析の存在を考えて、non-unique argumentで検討することにする。
1) 例えば、オープンソースのRが導入済みまたは導入可能であると仮定する。
2) エクセルにできて、Rにできない統計解析はない。
3) 従って、企業がエクセルを導入したとしても、新しく実行可能になる統計解析はない。
以上。

： １３２人目の素数さん [sage] 2011/04/11(月) 20:49:10.68

1)が偽だったら何の意味もない議論だなｗ

： １３２人目の素数さん [sage] 2011/04/12(火) 18:15:07.51

>>73

こういう本見て、そこの仕事と関係ある部分を箇条書きにすれば良いと思う。
外部リンク

ttp://www.amazon.co.jp/gp/product/479811958X/

： １３２人目の素数さん [] 2011/04/16(土) 22:29:22.99

>>46

妥当ではないとは具体的に？

： １３２人目の素数さん [] 2011/04/16(土) 22:36:56.43

非線形回帰モデル
y = a*x1 + a*b*x2 + u
において、y、x1、x2のデータがあるときにaとbの推定を考えます。
その方法として残差平方和u^2を最小にするようなaとbを直接求める方法と、
u^2をaとbに関して微分して0とおいた一階の条件を非線型方程式とみなして
求める方法はどちらがいいのでしょうか？

： １３２人目の素数さん [] 2011/04/17(日) 00:31:45.15

>>79

それ非線形なの？
線型にしか見えないけど？

： １３２人目の素数さん [] 2011/04/17(日) 02:11:01.55

>>80

パラメータaとbについては非線形だと思います。
パラメータaとbをデータの線形関数としてexplicitに表現できないと思いますので。
もちろん「変数」に関しては線形ですが。

： １３２人目の素数さん [] 2011/04/17(日) 03:41:54.70

>>81

両辺をaで割れば、
y/a = x1 + b * x2 + u/a
となるんじゃないの？

： １３２人目の素数さん [] 2011/04/17(日) 03:59:01.87

>>82

でもa自体が未知なので変換は不可能じゃない？

： １３２人目の素数さん [] 2011/04/17(日) 15:07:32.72

y = a*x1 + a*b*x2 + u

のa*b = cとおいて、

y = a*x1 + c*x2 + u

とすれば普通の回帰分析と同じ。
そして、aとcを求めてから、
cをaで割るとbが求まります。
よって線型と同じです。

： 79 [] 2011/04/17(日) 15:51:49.81

すみません、前に書いたモデルは一つの例で、あまり適切ではなかったようです。
実際は変数に関しては線形で、パラメータに関しては非線形なモデルで84が指摘しているような
簡単な方法では扱えないモデルです。
問題は目的関数を直接最小化するのと一階の条件を使うのとどちらが良いのかということです。

： １３２人目の素数さん [sage] 2011/04/17(日) 16:44:18.49

>>84

そのように置いたらaとcは独立ではないよね。

： １３２人目の素数さん [] 2011/04/17(日) 18:51:01.98

>>86

ええ。そうしなくても独立ではないですよね？

>>85

こういうのをやりたいということですか？
外部リンク

ttp://www.cs.osakafu-u.ac.jp/hi/honda/mathematics2.htm

：忍法帖【Lv=19,xxxPT】 [sage] 2011/04/17(日) 19:46:06.04

通常用いられている統計学とは別にベイズ統計学とかいうのがあると知りました。
ベイズ統計学はどういうところで使われているんですか？
普通の統計学にたいして利点と欠点とかってあるんでしょうか？

： 79 [] 2011/04/17(日) 20:12:17.21

具体的に言うと
y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u
という回帰モデルでa,b_1,...b_kの推定を考えています。

： １３２人目の素数さん [] 2011/04/17(日) 23:02:45.42

>>88

ベイズの公式を利用するものをベイズ統計学という。
どんな問題でも、常にベイズの公式を使う人のことを
ベイジアンといいます。
ベイズの公式は単純ですけど、奥が深いらしいです。

利点はベイズの公式を利用できることですかね？
欠点はないです。
だってベイジアンでないかぎり、ベイズの公式を使っても
使わなくてもいいんですから。

： １３２人目の素数さん [sage] 2011/04/17(日) 23:17:48.07

>>90

>欠点はないです。
ベイズは概して計算量が増えます。

： １３２人目の素数さん [] 2011/04/17(日) 23:37:54.83

>>89

y = (a+b_1+...+b_k)*x_0 + a*b_1*x_1 + ... + a*b_k*x_k + u

これを書き換えると

y=a*x_0 + (1+a)*b_1*(x_0 + x_1) + ... + (1+a)*b_k*(x_0 + x_k) + u

x_0、x_0 + x_1、...、x_0 + x_k って変数を作って、重回帰分析をして、
もとまった係数から、順番にb_1からb_kまでを決めていけばいい。

： １３２人目の素数さん [] 2011/04/17(日) 23:40:48.41

あ、ごめん、見間違ってた。

： １３２人目の素数さん [] 2011/04/18(月) 02:18:12.99

計量経済で言うコクランオーカット法の推定と同じような問題かな？

： １３２人目の素数さん [sage] 2011/04/18(月) 18:11:22.42

ＣＲＦってわざわざ名前つけるほど特別な方法でもないじゃん
なんで騒がれてんのか不明だわ

： １３２人目の素数さん [sage] 2011/04/18(月) 23:31:50.66

>>87

aとa*bはそりゃあ独立じゃないですよ。
aとbを別に求めたいから非線形ということですよね。

： １３２人目の素数さん [] 2011/04/22(金) 09:25:33.58

データが「正規分布に従う」と言うためには何をすれば（何を示せば）いいですか？

： １３２人目の素数さん [sage] 2011/04/22(金) 16:27:42.03

>>97

宿題？それとも試験中？

： 97 [] 2011/04/22(金) 19:36:59.20

>>98

工学系の論文です。

100

： １３２人目の素数さん [sage] 2011/04/22(金) 19:51:27.25

論文なのにこんなところで聞くのかｗ
参考文献に2chと書くのか？ｗ

101

： １３２人目の素数さん [sage] 2011/04/22(金) 19:54:52.25

胸が熱くなるな…

102

： 97 [] 2011/04/22(金) 20:37:35.46

>>100

ここで概要を聞いた後に文献を引いて詳細を調べようと思います。

103

： １３２人目の素数さん [sage] 2011/04/22(金) 21:34:04.74

>>102

データの分布について、正規分布かどうかの検定をする。
あたりまえすぎて、答えになるかな…

104

： 97 [] 2011/04/22(金) 23:16:49.37

>>103

正規性検定の方法を調べてみたらいろいろ出てきましたが、
よく使われるものや使わない方がよいものはございますか？
- Anderson–Darling test
- Kolmogorov–Smirnov test
- Shapiro–Wilk test
- Smirnov–Cramér–von-Mises test

105

： １３２人目の素数さん [sage] 2011/04/22(金) 23:18:35.61

>>104

概要を聞いたら、詳細に調べるんじゃなかったっけ。

106

： 97 [] 2011/04/23(土) 01:20:54.07

>>105

はい、それぞれの手法の詳細は現在調べているところです。

最初に質問したときは「正規性の検定と言えばこれ」という
手法があると思っていましたが、いくつもの手法が出てきた
ため、定石があれば教えていただきたいと思い質問しました。

107

： １３２人目の素数さん [sage] 2011/04/23(土) 08:13:17.77

>>106

統計の手法は、データの特性によって手法が違うので、自分のデータにあった手法を選ぶしかないね。
それは、各手法を調べればわかること。

108

： 97 [] 2011/04/23(土) 10:11:01.86

>>107

ありがとうございます。
各手法の詳細を学んだ上で、自分のデータに最適な手法を選択します。

>>98

, 103
お礼が遅くなりましたが、ありがとうございます。

>>107

と同じ方かも
しれませんが、違う方でしたらいろいろな方々にお世話になりました。

109

： １３２人目の素数さん [] 2011/04/24(日) 21:20:58.83

ベキ分布でリスク管理のすすめ
外部リンク

ttp://f.blogos.livedoor.com/opinion/article/5513200/

110

： １３２人目の素数さん [] 2011/04/24(日) 22:09:22.10

>>108

データ数が多いほど、正規性の検定で棄却されるから、
泣かないようにね。
もし、正規性の検定が研究の中心テーマでないなら、
検定なんかしなくて、ヒストグラムのみ示しておいて、
「正規分布と仮定して、、、」と進めればよいと思います。

棄却されないために、わざと検定しない奴多いんですよ。（爆
また、実験などでデータ数を調整できるような研究なら、
データは少なめにしたほうがいいかも？

111

： １３２人目の素数さん [] 2011/04/27(水) 13:01:13.59

小説に歴史上の数学者を登場させたくて、
確率論、特に正規分布などの歴史について調べています。

Wikipedia以外で、ここが詳しい、というサイトがあったら教えてください。

112

： １３２人目の素数さん [sage] 2011/04/28(木) 13:24:03.84

物書きに掲示板の情報をもとにネットで調べて済まそうという態度が見えて驚いた

113

： １３２人目の素数さん [sage] 2011/04/28(木) 14:49:13.68

>>112

ニートなので出費はちょっと……。
最寄りの図書館にも数学史無かったし……まあ諦めます。

114

： １３２人目の素数さん [sage] 2011/04/28(木) 21:49:10.37

>>113

ちょっと登場させるぐらいならWikipediaの情報で十分な気がするが。
正規分布はガウスが発見したが、Wikipedeiaのガウスのところは相当詳しいよ。

115

： １３２人目の素数さん [sage] 2011/04/28(木) 22:38:47.02

>>114

おおっ。良くまとまっていますね！thanks！

116

： １３２人目の素数さん [sage] 2011/05/04(水) 20:17:27.97

この問題はカイ二乗分布の表を使って解くのでしょうか？
どなたか詳しい解き方を教えて頂けたら嬉しいです。
なんかいまいち参考書を読んでも解き方がわからない...

正規分布に従う母集団から次の標本が存在する
66.303、15.102、84.942、53.234、93.443、63.132、45.295
この時、母集団の平均と分散を信頼係数95％で区間推定せよ。
(解答は小数点以下第４位まで求めよ)

117

： １３２人目の素数さん [sage] 2011/05/05(木) 01:07:45.13

>>116

サンプルが与えられてて、サンプルサイズがわかってれば、信頼区間の式に入れるだけ。

118

： １３２人目の素数さん [] 2011/05/05(木) 06:36:06.04

平成20年度文部科学省発表のいじめについての統計データを参考にレポートを書いているのですが、学校総数がわかりません。
統計表のどこを見ればわかるものなのでしょうか?

外部リンク

ttp://www.mext.go.jp/b_menu/houdou/21/11/__icsFiles/afieldfile/2009/11/30/1287227_1_1.pdf

119

： １３２人目の素数さん [sage] 2011/05/05(木) 07:21:36.82

>>118

ｐｄｆは見ないで書くけど、ないなら他から探して持ってくる。

120

： １３２人目の素数さん [sage] 2011/05/05(木) 11:45:02.47

>>116

平均の推定はt分布
分散の推定はχ二乗分布

121

： １３２人目の素数さん [sage] 2011/05/05(木) 15:44:47.42

>>118

表の中に38698校とあるやつではないわけ？

122

： １３２人目の素数さん [] 2011/05/05(木) 16:58:23.57

>>121

でも、(2ー1)では総数40285校なんですよね。
こういう調査って総数は一致しないものなのですね.

123

： １３２人目の素数さん [] 2011/05/06(金) 19:58:32.59

>>122

>>119

だけど、なんか適当なこと書いてるのでpdfを読んでみた。
とりあえず、統計資料使う時は「注」を読もうね。

私の学生が「こういう調査って総数は一致しないものなのですね」って
言ったら叱ってるｗ

まず、「（１－１）暴力行為の発生状況」と「（２－１）いじめの認知
学校数・認知件数」をみると（１－１）には特別支援学校が含まれていない
のでその分（２－１）が多い。

（２－１）の注を見ると「注３）学校総数のうち、高等学校の全定併置校は
全日制、定時制をそれぞれ１校（計２校）として計上しているため、学校基
本調査の数値と一致しない。」と一致しない理由が書いてある。

（１－１）では国立170、公立36242、私立2286で、（２－１）の数字から
特別支援学校を除くと、国立が170（＝215-45）、公立36775（＝37741-966）、
私立2314（＝2329-15）となっていて、国立以外は（２－１）の数字が大きい
ので、その部分が全日制と定時制を両方やってる学校で、そういのは別の学校と
してデータを処理してるのがわかる。

また、（２－１）の注を見ると「（注４）休校等の学校があるため、認知した
学校数と認知していない学校数の合計は、学校総数と一致しない。」とあり、
学校総数40285に比べ、表の認知した学校及び認知していない学校の計は40082
と小さくなっているので、（１－１）を見るときも休校などが考慮されていない
と予想できる。

124

：れが [] 2011/05/06(金) 21:56:57.84

問題：
三角形Ωから無作為に一点を抽出するという試行を考える。この試行に対する標本空間はΩそのものであるが、確率変数X,Y：Ω→Rをそれぞれω∈Ωに対して、X(ω)=ωのx座標、Y(ω)=ωのy座標で定義するとき、
１)　P(Y>=1)=□、P(X^2+Y^2>=1)=□、

２） Xの確率密度関数f(X)はf(X)=□、E[X]=□、
　　 Yの確率密度関数g(y)はg(y)=□、E[Y]=□、

□を求める問題です。
図がなくて申し訳ありません。X座標が１、Y座標が２の三角形Ωです。
分かるかた教えてください。
よろしくお願いします。

125

： １３２人目の素数さん [sage] 2011/05/06(金) 22:09:34.67

>>124

すぐに答える気はないんだけど

とりあえず、三角形の頂点の座標が
(0,0)、(1,0)、(0,2)
ってことかな？

126

：れが [] 2011/05/06(金) 22:10:37.07

>>125

そうです。

127

： １３２人目の素数さん [sage] 2011/05/07(土) 14:24:10.69

>>124

携帯だし詳しく書けないし、文系だしまちがっててもよければ。三角形の面積が1だから、面積がそのまま全確率になる。

1→三角形のうち、Pの中の式を満たす面積が答え。図を書けばいいと思う。

2→三角形の斜辺をxの式で書く。その式が答え。
でも、解答欄の□がでかいなら解答として「0≦x≦1のとき」としたほうがいい。
正確には「0>x，x>1のとき」はf(x)＝0と場合分けする。次に∫x×f(x)dxを三角形がある範囲でする。
小さい解答欄にそれかくと空気読めてないと思われるかも。

同様にyの式で書く、∫y×f(y)dyを三角形がある範囲でする。

128

： １３２人目の素数さん [sage] 2011/05/07(土) 14:57:56.77

>>127

>>125

だけど、三角形なんだから、積分しなくても期待値はでるでしょ。高さに当たる方を半分にすればいい。

129

： １３２人目の素数さん [sage] 2011/05/07(土) 20:42:58.13

>>117

>>120

ありがとうございます。

この問題の分散は、カイ二乗分布を使って標準偏差を出してそれを二乗すれば出る、
という認識で正しいでしょうか？

130

： １３２人目の素数さん [sage] 2011/05/08(日) 23:35:11.89

どうしてそんな認識になるのか僕にはわけがわからないよ。

131

： １３２人目の素数さん [sage] 2011/05/09(月) 01:48:21.68

>>130

多分、信頼区間ってものが全然わかってないんだと思う。

132

： １３２人目の素数さん [sage] 2011/05/09(月) 11:37:29.77

こりゃ毎回生徒をいびりにくる先生から説教してもらわなな

133

： １３２人目の素数さん [age] 2011/05/09(月) 12:10:04.32

>>130

>>131

>>132

カイ二乗分布の母標準偏差の二乗が、カイ二乗分布の分散であるという記述を見たので、先ほどの問題で分散を求める際はこれに従えば良いと思っていました。

これはやはり誤りでしょうか？
教科書を読んでもこの程度しか理解できませんでした･･･

どなたかアドバイス頂けませんでしょうか。よろしくお願い致します。

134

： １３２人目の素数さん [sage] 2011/05/09(月) 12:39:27.96

>>133

ある分布があって、その標準偏差は分散をルートしたものだから、標準偏差を２乗すれば分散になる。

でも君のデータはχ二乗分布なの？

平均値についての信頼区間は、データの平均を中心に信頼区間の式で区間を決めるよね。その時にt分布か標準正規分布を使う。

分散も同じように考えて、データからの分散を基準に分散についてぬ信頼区間の式で区間を求める。
その時に、信頼区間の設定（90%とか95%とか）に対応したχ二乗分布の値を使う。

135

： １３２人目の素数さん [sage] 2011/05/09(月) 12:45:08.00

ついでに書くと、平均値についてはマイナスを取ることもあるから、データの平均値の両側にプラスマイナスで範囲を取ってもいいけど、分散はマイナスにならないから比で評価して、データの分散の何分の一とか何倍までという方法で信頼区間を決めてる。

とりあえず、分散の信頼区間の式をよく見るんだ！

136

： １３２人目の素数さん [sage] 2011/05/09(月) 13:25:32.52

>>133

ストーリーがわかってないような気がした
分かっていたらすまん
数学的な話を抜きにして、発想の話

例えば、池の中の魚の身長の平均や分散を知りたい
→全部調べるのむり
→とりあえず10匹捕まえた(標本)、10匹の身長平均は10センチだった
→ひょっとして、池の魚の平均身長は10センチ？(点推定)
→でも、よくよく考えたら、次に10匹とってまた身長平均が10センチとはかぎらないよな
→でかいのが10匹とれたり、小さいのが10匹とれたりするかも
→サンプル平均は大小さまざまな値をとるな
→池全体の平均を10センチとドンピシャでよそうするのは怖い
→平均は8センチ～12センチにあるとか幅もたせて予想するか
→これが区間推定

サンプル平均やサンプル分散はどのような大小さまざまな値をとる
しかし、実はそれぞれ工夫をすれば特徴的な分布に従う
そして、その分布を見ながら95％の確率まであたるように予想範囲を広げる

137

： １３２人目の素数さん [sage] 2011/05/10(火) 18:04:02.52

大数の法則のおかげでこんだけサンプルとれば
信頼に足る母集団の情報が得られますよって判るのか！

138

： １３２人目の素数さん [sage] 2011/05/10(火) 18:26:25.60

>>137

んだ

139

： １３２人目の素数さん [sage] 2011/05/11(水) 19:03:04.39

区間推定の信頼率って、本来は極限とった先での値だよね
有限の場合で考えても、極限にどれだけ近いか（オーダーじゃなくて、正確に数値で）わからないと、
95％なんて具体的な値を引き合いに出しても意味なくね？

140

： １３２人目の素数さん [sage] 2011/05/11(水) 19:04:45.90

訂正

"（オーダーじゃなくて、正確に数値で）"は削除

141

： １３２人目の素数さん [sage] 2011/05/11(水) 22:29:30.52

>>139

小標本特性についてはわかっていない場合が多いが、例えはｔ分布については特性が数学的にわかってる。
その代わり、母集団の分布に制限がある。

中心極限定理は、母集団に制限がないから凄いわけ。（特殊な分布を除く）

で、小標本特性がわかって無いのが多いので、シミュレーションでサンプルサイズが小さい時の特性を求めるか、仕方ないので極限を取って利用してる。

ということで、全く意味がないわけではない。

142

： １３２人目の素数さん [] 2011/05/11(水) 22:50:42.61

>>139

まず、

>>141

に追加

>中心極限定理は、母集団に制限がないから凄いわけ。（特殊な分布を除く）
その代り、サンプル数が大きくないといけない。
ただし、実際には無限のサンプルサイズは取れないし、30とか50のサンプル
があれば実用上はそれほど問題がないこともわかっている。
t分布表と標準分布の表を比べてみるとわかるよ。

次にちょっと補足しておくと、小標本の場合は数学的（解析的）にサンプル
の分布の状態が求まらない。これは式で表せないということであって、少ない
サンプル数での分布は存在する。

なので、例えばサンプルサイズが10しか取れないなら、ある分布の母集団から
10個をサンプルサイズとして取った場合にどうなるかをたくさん試すことで、
10個の時の信頼区間がシミュレーションにより求まるから、それを使えばいい。

143

： １３２人目の素数さん [] 2011/05/12(木) 13:22:18.88

(平均,分散)=(0,1)から10個取り出した10個の平均値は、
0±10なら、確率100% 、
0±3程度なら、ヤマカンなのだけど、確率68.3%だろう。

ところで、その逆(のようなこと）である、
10個の平均値が、zeroの場合の
元の分布（これが正規分布で分散１であると仮定し）
元の分布の平均（つまり母平均）の確率分布を求めたい。
どうもなんだか、すっきりしないから。

144

： １３２人目の素数さん [] 2011/05/14(土) 09:55:16.63

ttp://up3.viploader.net/ippan/src/vlippan207769.jpg

145

： １３２人目の素数さん [sage] 2011/05/14(土) 21:05:24.91

>>144

距離が近い分だけ放射能が高いが、すでに米ソの核実験が頻発していた
時代ぐらいまで下がったわけだ。このまま原発が安定してくれればね。

146

： １３２人目の素数さん [] 2011/05/15(日) 10:52:52.19

【統計】女子大生の性体験率は62% 女子高生は30%でともに肉食化
ttp://toki.2ch.net/test/read.cgi/dqnplus/1304856492/

147

： １３２人目の素数さん [] 2011/05/16(月) 23:18:20.94

すいません。下記のような実験を行った場合、平均値や分散の有意差の有無を調査するにはどのような統計処理が普通なのでしょうか（実験誤差は正規分布に従うと仮定）
（１）条件A　B　Cで各条件10サンプルを並行して行いデータを取った。
（２）上記の実験を三回繰り返した（各条件10*3のデータ数）
二元配置で三回の繰り返し数を各水準にするのも変な感じがしました。ご教示お願いします。

148

： １３２人目の素数さん [] 2011/05/17(火) 10:31:45.76

>>147

ABCで１０サンプルｘ３なら
それぞれ３０サンプルということでいいじゃん？

３０サンプルのが３つある、ということで
ABCを比較すればいい。
条件は同じなんでしょ？

149

： １３２人目の素数さん [sage] 2011/05/18(水) 23:43:29.31

>148　レスありがとうございます。はい。条件は同じです。

150

： １３２人目の素数さん [sage] 2011/05/19(木) 20:23:43.52

質問があるのですが、どなたかご回答をお願いします。

平均点が５８、分散１６のとき、得点が６５の人の偏差値はいくであるか？

自分の考えでは、10・(65-58)/16+50=54.357になりました。

分散と標準偏差値を同じように扱ってしまっています。
どなたかご教授お願いします。

151

： １３２人目の素数さん [sage] 2011/05/19(木) 20:29:18.28

>>150

分散は標準偏差の二乗。
標準偏差は分散をルートしたもの。

152

： １３２人目の素数さん [sage] 2011/05/20(金) 01:36:12.31

>>150

分散ちゅうのはテスト受けたやつらの点数のバラツキの指標や。

バラツキ知りたかったら、平均からAさん、Bさん、Cさん…がいくら離れてるかしらべる。
で平均から離れてた点数を合計して人数(もしくは人数－1)で割ったら大体のバラツキが分かりそうやろ。

でも、この計算には問題がある。平均よりマイナスのやつとプラスのやつそのまま足したら打ち消してまうやん。
2人しかおらんと仮定して、0点と100点、49点と51点のテスト結果のバラツキ指標が同じになってまう。
前者のほうが、実力バラついてるやろ。
だから平均から離れてた点数を2乗して合計してから人数(もしくは人数－1)で割るんや。それが分散。

でも2乗したまんまやと気持ち悪いやろ。単位が点の2乗とか意味不明やし。だから最後にルートしたくなる。それが標準偏差。
2乗したやつをルートして点ベースに戻してるから、大体平均から±○点くらいバラついてんやなって分かる。

さらに言えば、Aさん、Bさん、Cさん…の全員の点数から平均点をひいてみる。
当たり前やけど、引かれた点数をもとに平均点を出すと０点になるやろ。
さらに、Aさん、Bさん、Cさん…の点数を標準偏差で割ると、標準偏差が1になる。あんまりばらつかんようになる。
(100点満点のテストを10点満点にした感じ)

この発想が
(点数－平均)/標準偏差

みんなの点数をこの式にいれて、これを点数にしたら平均０で大体±1に収まるのではないかと発想したくなる。
その発想をもとに、偏差値はどういう指標なのかを考えてみては。
平均点とれば偏差値50とかの意味もわかると思う。

153

： １３２人目の素数さん [sage] 2011/05/20(金) 02:06:38.32

その関西弁イラつくからやめて下さい

154

： １３２人目の素数さん [] 2011/05/20(金) 08:33:36.99

というか、10・(65-58)/16+50=54.357　の式を書いてる段階でそれなりに
勉強はしてる。

>>152

の説明だとかえってわからない、混乱させるよ。ｗ

155

： １３２人目の素数さん [sage] 2011/05/20(金) 10:21:36.72

>>152

自分は納得できました。
たまにくる教員の方？より分かりやすいです。

156

： １３２人目の素数さん [sage] 2011/05/20(金) 11:07:32.00

>>155

みたいに教科書を読んでも理解できないのが、
「マンガでわかる統計学」の購買層なんだろうなw

157

： １３２人目の素数さん [sage] 2011/05/20(金) 12:04:01.23

>>154

あなたも理解が足りてませんね。
基準化するのに分散で割ってる人を学習が進んでると判断するあたり。
似てる式ですが意味が全く違いますよ。単位が違いますから。

標準正規分布を利用した検定推定。特に区間推定と基準化の関係。
さらには標準正規分布から派生するカイ二乗分布などでの式変換の意味がわかっていないということです。

式を丸暗記したり、似てるものを書ければ学習が進んでるとはいいませんよ。

158

： １３２人目の素数さん [sage] 2011/05/20(金) 12:13:35.42

156は教員で悔しかったのかなw
ひさびさにﾜﾛﾀ

159

： １３２人目の素数さん [sage] 2011/05/20(金) 12:46:50.63

いや、たまにくる教員は俺（

>>154

）だ。w

>>157

当人が、分散と標準偏差を同じに使ってると書いてるので、違いを教えておけばいい。

宿題や試験をそのまま聞くのがいるので、先ずはヒューリスティックな説明をして、わからなくてまた聞くようなら、追加で説明してるので、分かりづらいと思われるのは想定内。

160

： １３２人目の素数さん [sage] 2011/05/20(金) 14:08:02.72

先生！
宿題ききにきて挙げ句ケンカする大学生をなんとかしてください！
ここはもはや動物園です
でも好きです

161

： １３２人目の素数さん [sage] 2011/05/20(金) 15:14:25.55

私も好きなので、止める気はありません。
授業評価もないので、静かにさせなくても問題ないし。w

162

： １３２人目の素数さん [sage] 2011/05/21(土) 00:45:12.43

すんません。
X～x^2(n)のとき
a*X～a*x^2(n) になりますか？

163

： １３２人目の素数さん [sage] 2011/05/21(土) 09:57:37.52

x^2(n) って何？

164

： １３２人目の素数さん [sage] 2011/05/21(土) 10:56:55.70

カイ二乗じゃないかな

165

： １３２人目の素数さん [sage] 2011/05/21(土) 20:57:19.16

>>162

です
そうですカイ二乗分布です
説明不足ですいません

166

： １３２人目の素数さん [sage] 2011/05/22(日) 01:40:50.58

>>165

ならない。

χ二乗分布の確率密度関数と変数変換の公式で計算してみるといいよ。
綺麗な形にならないと思う。

167

： １３２人目の素数さん [sage] 2011/05/22(日) 02:12:13.11

a*x^2(n)って何？カイ二乗分布のa倍？

168

： １３２人目の素数さん [sage] 2011/05/22(日) 02:41:15.19

分布関数を考えて、それが元の型のa倍になるかを聞いてるんだと思う。

169

： １３２人目の素数さん [sage] 2011/05/22(日) 02:46:47.72

xがn(μ，σ^2)の正規分布の時、y=(x-μ)/σ^2とすると、yはn(0，1^2)で、標準正規分布になるみたいなことを聞きたいんだと思う。

170

： １３２人目の素数さん [sage] 2011/05/22(日) 07:42:10.64

>>169

y=(x-μ)/σ^2　じゃなくて、y=(x-μ)/σ　に修正。

171

： １３２人目の素数さん [sage] 2011/05/22(日) 13:43:58.12

>>168

それってa倍したものが再生性があるとか考えなくてよいなら
どんな分布でもそうなんじゃない？

>>169

は再生性の話だよね。

172

： １３２人目の素数さん [sage] 2011/05/22(日) 15:10:49.05

>>168

a倍した変数が従う分布「～a*x^2(n)」と書いてるので、
a倍した新しい変数の確率を考えるとこれはおかしい。
全ての確率が１になってない。

全ての確率が１になるような分布関数の形状の話ではなく、
対応関係だけを考えているなら、

>>171

のコメントもありかな。

Y=aX　ってのは、新しい変数Yの分布を考えた時に、その値が
aXと等しければ、元の分布のXの時の確率が与えられる。

例えば、X=1の確率が0.5、X=2の確率が0.7だとして、Y=2Xで
新しい変数Yが与えられたら、Y=0.5で確率が0.5、Y=1で0.7。
（ここまでならあり）

ただ、普通は変数変換して、y=φ(x)という変換をした場合、
元の密度関数がf(x)ならば、yについての密度関数は、x=ξ(y)
として、g(y)=f(ξ(y))|dξ(y)/dy|　となる。

χ二乗分布の場合、f(x)の中のガンマ関数部分は無視するとしても
X^(m/2-1)*e^(-X/2)　という項があって、ここのXをY/aに置き換え
た物が出てくるので、積分して分布を考えても元のa倍にはならない。

173

： １３２人目の素数さん [sage] 2011/05/22(日) 15:13:45.92

>>171

あ、肝心なことを答えてなかった。

>>168

、169で書いたのは、再生性というよりも、変数変換した後の
分布の形状の話で、それは元の分布にaを掛けたものにはならない
ってことです。

174

： １３２人目の素数さん [sage] 2011/05/22(日) 19:07:53.74

回答的には
確率変数 X が自由度 n のカイ自乗分布にしたがう時、
確率変数 Y = aX ( a > 0 ) の確率密度関数のグラフは
自由度 n のカイ自乗分布のグラフの横軸を a 倍、縦軸を 1/a 倍
したものになる。
でＯＫ？

175

： １３２人目の素数さん [sage] 2011/05/22(日) 20:18:53.89

>>174

正規分布ならそれでいいけど、χ二乗分布だとそうは言えない。

>>172

に書いたΓ分布以外の項があるので綺麗にならない。

例えは、自由度２のχ二乗分布の累積密度関数で、０の値（高さ）を計算すると、0.5になる。
これは、y=axで変換しても、y=0で高さが0.5になるってこと。

まあ、χ二乗分布は自由度が高くなれば、漸近的に正規分布に近づくので、そういう意味では、だいたい1/aの高さになると考えてもいいけどね。

176

： １３２人目の素数さん [sage] 2011/05/22(日) 22:04:16.43

あ、例えで、嘘書いたかも。w

177

： １３２人目の素数さん [sage] 2011/05/23(月) 00:09:54.43

例えだけでなく一般論的にも嘘というか勘違いだけど

178

： １３２人目の素数さん [sage] 2011/05/23(月) 00:11:01.74

0の値の高さは半分になるよね。
また、変数変換ではy=axならx=y/aでg(y)=f(y/a)/aだよね。
だから変換後の分布はカイ二乗分布にはならないけど
密度関数でいえば

>>174

で正解だね。

179

： １３２人目の素数さん [sage] 2011/05/23(月) 01:04:12.14

>>178

g(y)=f(y/a)/a　の処理で、悩んでたんだけど、χ二乗分布か
どうかって話を別にすれば、分布の形は高さが1/a　になった
ものだね。

χ二乗分布にこだわりすぎて、単純なところで勘違いしました。
ありがとうございます。

180

： １３２人目の素数さん [sage] 2011/06/01(水) 00:30:09.00

多頻度飽和アイテム集合と多頻度アイテム集合との違いがいまいち
分からないのですがご教授下さい。
聞く場所が分からないのでスレチかもですが。。

181

： １３２人目の素数さん [sage] 2011/06/01(水) 10:35:54.89

データマイニングの用語のようだね。
ここで反応あるかな？

182

： １３２人目の素数さん [] 2011/06/01(水) 11:18:43.31

宿題でましたので教えて頂きたいです
問い→日本人の血液型Ａ、Ｂ、Ｏ、ABの比率は４:３:２:１であることが知られている。
１１０人の学生の血液型を調べたところ、その比率は５２人:３５人:１８人:５人であった。
この学生達の血液型比率は日本人の血液型比率に適合していると言って良いか?
有意水準５％でこれを検定せよ。

お願いします

183

： １３２人目の素数さん [sage] 2011/06/01(水) 12:26:50.74

>>182

適合度検定でググると、具体例も含んだ説明がたくさんあるよ。

184

： １３２人目の素数さん [] 2011/06/02(木) 05:42:09.96

統計学会の一般講演申し込み締め切り間近です。
今年は申し込み少ないみたいです。
番号がまだ２桁だし。。。

185

： １３２人目の素数さん [] 2011/06/02(木) 07:11:47.94

場所が九州大学の伊都キャンパスという、
鳥も通わぬド僻地なので、誰も行きたがらない？

なぜ伊都のようなド僻地に移転したのか？
九州にありがちな賄賂と政治とヤクザと、(ry

186

： １３２人目の素数さん [sage] 2011/06/02(木) 11:11:51.81

鳥はたくさんいますが。

187

： １３２人目の素数さん [sage] 2011/06/02(木) 13:56:13.00

僻地といっても空港から１時間。
東京から京大に行くのと伊都キャンパスに行くのでは
ほとんどかかる時間は変わらないのだ。

188

： あんでぃは無能 ◆AdkZFxa49I [sage] 2011/06/02(木) 16:34:08.86

あんでぃ

189

： １３２人目の素数さん [] 2011/06/02(木) 17:12:23.06

アンディ・フグのかかと落しは強烈だった。

190

： １３２人目の素数さん [] 2011/06/04(土) 02:18:28.65

博多って一度もいったことないから全然わからない。
どこらへんに泊まるといいの？

191

： １３２人目の素数さん [sage] 2011/06/04(土) 21:54:20.67

LOTO６の出目の出る間隔を確率分布で表すと
Χ二乗分布？

192

： １３２人目の素数さん [] 2011/06/05(日) 12:44:21.92

統計士の講座の内容は、質どう？

193

： １３２人目の素数さん [] 2011/06/05(日) 17:16:30.36

>>191

出目の出る間隔って、どこのこといってるの？
例えば、１と１０がでたら差が９とか、そういう意味？

194

： １３２人目の素数さん [] 2011/06/05(日) 22:36:51.98

教えてください　お願いします
ある東京都内のA医大病院は，収容される救急患者数Xがλ＝2.5のポアソン分布Po(2.5)に従う．救急患者のために常時何床の空きベッドを確保すればよいか，ベッドが不足する確率を求めることで考察する．なお，エクセルの計算では関数「=EXP()」を用いよ．

( i )ある時点で，救急患者がちょうど一人もいない確率，救急患者によってベッドがちょうど１床埋まっている確率，ちょうど２床，ちょうど３床，ちょうど４床埋まっている確率，計５通りを求めよ．
(ii )救急患者のために，２床の空きベッドを確保しているとき，３床の空きベッドを確保しているとき，４床の空きベッドを確保しているとき，それぞれにおいて，ベッドが不足する確率を求めよ

具体的な解き方を教えてください
たぶん当てはめる式は同じだと思うので、
( i )ある時点で，救急患者がちょうど一人もいない確率
(ii )救急患者のために，２床の空きベッドを確保しているとき
の２通りについてのみの詳細な解き方をおしえてください

195

： １３２人目の素数さん [] 2011/06/06(月) 00:00:38.06

>>194

分かったので却下します

196

：猫 ◆MuKUnGPXAY [age] 2011/06/06(月) 00:18:47.83

>理由があるかどうかはともかく、痴漢で懲戒免職後に受け入れてくれる大学などないだろう。
>未練があろうが、日本の大学への復活は無理。
>最近の研究業績はいまいちなので、海外の大学で給料をもらうのも無理。

猫

197

： １３２人目の素数さん [] 2011/06/06(月) 00:21:56.02

貼り付けただけで逃げようとする猫はウジ虫。
現実を直視できない悲しさ。

198

： あんでぃ ◆AdkZFxa49I [] 2011/06/06(月) 00:22:28.33

あんでぃ

199

： １３２人目の素数さん [sage] 2011/06/13(月) 21:59:40.04

>>193

いえ
第n回が 1 4 10 18 22 40 43 (15)
第n+1回が 4 14 19 23 41 42 (11)
第n+2回が 1 12 13 27 37 38 (9)
としたら
1の間隔は2
4の間隔は1
とみなします

指数分布ですか？

200

： １３２人目の素数さん [sage] 2011/06/14(火) 01:16:07.91

負の二項分布じゃないすか？

201

： １３２人目の素数さん [sage] 2011/06/14(火) 03:48:49.63

マジすか？

202

： １３２人目の素数さん [sage] 2011/06/14(火) 20:16:32.89

統計士ってなに？アクチュアリー？

203

： １３２人目の素数さん [sage] 2011/06/15(水) 00:24:20.05

民間の講座だな。
講座を終了したらもらえるそうだからあまり意味がなさそうだな。

204

： １３２人目の素数さん [sage] 2011/06/16(木) 01:04:33.27

統計勉強してみたいと思ってるんですが、入門書でお薦めってありますか？
漫画で分かる！とか絵で見て分かる統計学！みたいな、全くゼロの状態からとりあえず取っつきに、って感じのがあれば是非お願いします。
あとついでにそれが終わってちゃんと始めるならこれ、みたいなのもお願いします。

205

： １９１ [sage] 2011/06/16(木) 17:46:29.41

>>200

ああやっぱこれっすね
あり＾＾

206

： １３２人目の素数さん [sage] 2011/06/16(木) 20:45:03.79

すいません誰か教えてください

　　　　　　肺炎患者　　　　インフルエンザ　　　　　　
A地区　　　　３人　　　　　　　１人
B地区　　　　８人　　　　　　　５人
C地区　　　　６人　　　　　　　１人
D地区　　　１２人　　　　　　　４人
E地区　　　　７人　　　　　　　３人
F地区　　　１０人　　　　　　　４人

この時地区によってインフルエンザの割合に偏りがあるかどうか
確認するにはどうしたらいいですか？　

207

： １９１ [sage] 2011/06/16(木) 20:56:11.80

ああというか幾何分布ですね

208

： １３２人目の素数さん [sage] 2011/06/17(金) 01:22:42.49

>>206

偏りはないと思われ。

209

： １３２人目の素数さん [sage] 2011/06/17(金) 05:43:57.27

>>206

各地区の人口データを入手しろ。話はそれからだ。

210

： 206 [sage] 2011/06/17(金) 18:33:04.88

これだけじゃ無理ですかね・・・
もうちょっとデータ集めて考えてみます
ありがとうございます

211

： １３２人目の素数さん [] 2011/06/21(火) 10:01:54.00

ロジットモデルとロジスティック回帰モデルの違いを教えて下さい。

212

： １３２人目の素数さん [sage] 2011/06/21(火) 12:04:36.79

>>211

本質的には一緒。
関数の特定化の違い。

213

： １３２人目の素数さん [sage] 2011/06/23(木) 21:34:28.01

教えて下さい、お願いします

ある化学工場において、製品の収率(%)に影響を及ぼすと考えられる反応温度と
原料を因子として取り上げ、二元配置の実験を行つた。実験結果について解析せよ。
(収率は高い(数字が大きい)ほどよい)

　　　　　　　　　A1(40°)　A2(45°)　A3(50°）　A4(55°）
Bl(精製品)　　　　98.0 　　　　99.0 　　 98.6 　　　　97.6
B2(普通品) 　　　97.7 　　　　 98.0 　　 98.2 　　　　97.3
33(粗製品) 　　　96.5 　　　　 97.9 　　96.9 　　　　96.7

①構造模型に基づいて分解せよ(一般平均=総平均と仮定する)
②分散分析表を作成せよ
③Aの母平均の点推定値及び95%信頼限界を求めよ
④Bの母平均の点推定値及び95%信頼限界を求めよ

実験計画法によって道母数を推測するんだと思うんですかが表の書き方等が
いまいちよく分かりません……

214

： １３２人目の素数さん [sage] 2011/06/24(金) 01:06:35.40

表の書き方って教科書の例題にでも載ってるだろ…。

215

： １３２人目の素数さん [] 2011/06/24(金) 15:59:48.11

ｘ、Mをそれぞれ相関のある確率変数ベクトル、対称行列とします。
このとき、２次形式x'M^{-1}xの期待値を計算したいのですが、
この期待値はどういう仮定の下で存在すると言えるでしょうか？
問題は逆行列が含まれているので、そこをどうすればいいのかわかりません。
よろしくお願いします。

216

： １３２人目の素数さん [sage] 2011/06/24(金) 16:03:28.95

多変量正規分布の指数部分だよね

217

： １３２人目の素数さん [] 2011/06/24(金) 16:49:21.93

215の補足です。
対称行列Mも確率変数です。

218

： １３２人目の素数さん [sage] 2011/06/24(金) 17:04:12.44

Mが正定値とかいうことが知りたい？
質問がよくわからん

219

： １３２人目の素数さん [] 2011/06/24(金) 21:58:42.78

犬

220

： １３２人目の素数さん [sage] 2011/06/25(土) 01:46:49.67

条件って「確率１でMが正定値である」でいいんでないか？

221

： １３２人目の素数さん [] 2011/06/25(土) 05:23:53.35

>>218

説明不足ですみません。
E(x'M^{-1}x)が存在するための条件を知りたいということです。

別の例で言うと、相関のある確率変数XとYの比X/Yの期待値E(X/Y)を
計算したいのですが、そもそもこの期待値が存在するための条件は何か？
ということです。例えばXとYが独立で標準正規分布ならX/Yはコーシー分布
になりますが、期待値は存在しません。X/Yの期待値が存在するための条件を
知りたいということです。

222

： １３２人目の素数さん [] 2011/06/25(土) 06:07:43.80

22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222
22222222222222222222222222222222222222222222222222222222222222222222

223

： １３２人目の素数さん [] 2011/06/25(土) 21:18:37.33

不偏分散はなぜn-1で割るのか理解しようとして、このページを見ていたんですが
外部リンク

ttp://home.a02.itscom.net/coffee/tako08Annex2.html

標本平均からの偏差平方和　＝　真の平均からの偏差平方和　－　標本平均の分散*n

なので、1/nして分散にしようとすると、標本分散＝真の分散－真の分散/n　になるので
標本分散ではなく、標本分散*(n-1/n)　＝　標本平均からの偏差平方和/n-1

であることはわかりました。

ただこのWebページの説明の情報量という考え方については

Σ情報量　＝　Σ平均の情報量　＋　Σ偏差平方　　　は成立するけど

情報量　＝　平均の情報量　＋偏差平方　は成立しませんよね

この赤線ＡＣで示す「実際に観測される測定値」って何のことなんでしょうか？
標本１つ１つの値を２乗して総和したものを√した辺の長さ(効果)って何か意味のある数値なんでしょうか？

224

： １３２人目の素数さん [sage] 2011/06/25(土) 21:30:25.19

赤線ＡＣw
誤字脱字ないか？

225

： １３２人目の素数さん [] 2011/06/25(土) 21:43:44.32

赤い線分ACでいいですか

226

：忍法帖【Lv=12,xxxPT】 [sage] 2011/06/28(火) 22:42:19.72

新しくできた飲食店に初めて入っておいしくなかったとき
サンプリング数N=1では判断できないと思ってもう一回入るんだが
ほとんどの場合やはりおいしくないという事象は統計的にどう説明できるのですか

227

： １３２人目の素数さん [sage] 2011/06/28(火) 22:47:03.63

味のばらつきが小さいからN=1でも十分なんじゃない？

228

：忍法帖【Lv=12,xxxPT】 [sage] 2011/06/29(水) 00:23:56.98

逆に女心はバラツキが大きいから試行回数を増やすことには意味がある

229

： １３２人目の素数さん [sage] 2011/06/29(水) 08:07:13.73

>>226

それ、考え方が間違ってる。

製品を検査してみたら壊れてた。
いま検査した製品を、もう一度検査してもやっぱり壊れてる。

これは当たり前。
確認が終わったものについては、すでに統計的推測は関係ない。

ある大学の平均身長を知りたいから、サンプルを10調べる。数が少ないので、20にしてみる。これは意味がある。

でも、ある人の身長を測ったら、その人については終わりだよね。

230

： １３２人目の素数さん [sage] 2011/06/29(水) 11:32:22.74

>>229

飲食店は、通常、複数の料理を扱うと思うが。
あるレストランでは、オムライスがまずかった。
次回に同じレストランに行って、ミートスパゲティをオーダーすると、
まずいだろうか、うまいだろうかという話かもしれない。

また、曜日によって調理するアルバイトが異なり、アルバイトの調理能力に
差がある場合もあるだろう。

さらに言えば、ある料理を1品食べたとしても、次に出される1品は、
同じ料理としても、同じ味とは限らない。

231

： １３２人目の素数さん [sage] 2011/06/29(水) 17:15:35.74

X,Y,Zの３つの値があったとき、Yが100になるように標準化するとは、どういった手順を踏めばよいのでしょうか？

232

： １３２人目の素数さん [sage] 2011/06/29(水) 17:30:49.10

そんなムツカシイ問題に回答できませんわ

233

： １３２人目の素数さん [sage] 2011/06/29(水) 19:46:50.28

>>231

簡単なのは、Ｙで割って100倍。

234

： １３２人目の素数さん [sage] 2011/06/30(木) 01:22:37.65

>>230

そうだよね。この問題は色々考えられるよね。

ある料理に限定した場合、個人的経験からすると別の日に行ったらおいしく
感じたという経験はない。やはりばらつきは小さいのかな？
でもおいしさは個人差が大きいようでそれをおいしいという人もいる。
味の数量化は無理なのか…。

235

： １３２人目の素数さん [] 2011/06/30(木) 05:05:35.86

パターン認識の話になると思うのですが、
特徴量選択でSFS、SBS、SFFSについてご存知の方いらっしゃらないでしょうか？
これらのアルゴリズムについて簡単に説明してほしいのですが、、、

236

： １３２人目の素数さん [sage] 2011/06/30(木) 06:45:09.30

>>235

機械学習スレへどうぞ。

【統計分析】機械学習・データマイニング【集合知】
ttp://hibari.2ch.net/test/read.cgi/tech/1286200810/371

237

：忍法帖【Lv=13,xxxPT】 [sage] 2011/06/30(木) 21:21:50.35

女性の男性に対する感情も第一印象で決まるN=1の世界

238

： １３２人目の素数さん [sage] 2011/06/30(木) 22:39:14.40

世の中に本当に正規分布しているものなど絶対存在しないから

239

： １３２人目の素数さん [sage] 2011/06/30(木) 22:44:46.81

確率統計には絶対はないから。
数学的に0%でも絶対にないかと聞けばあると答えるのが数学者。

240

： １３２人目の素数さん [sage] 2011/07/01(金) 03:45:57.41

今、統計学で流行ってるのってなんだろ？

241

： １３２人目の素数さん [sage] 2011/07/01(金) 17:16:17.06

FXシステムトレーディングじゃねえの

242

： １３２人目の素数さん [] 2011/07/02(土) 10:42:09.63

すみませんが、考えてもどうにも分からないので教えてください

　
　　　　我が校の自宅外学生のうち無作為抽出により30人にアンケート調査したところ，家賃の平均は50000円，標本標準偏差は10000円であった．
この標本平均による，我が校の自宅外学生家賃平均の95％信頼区間，および99％信頼区間を求めよ．（これは求まりました)
　　　　ただし，我が校の自宅外学生の家賃は正規分布にしたがっているものとする．
　　　　上記のアンケートを，本統計学受講者の自宅外学生に対しておこなったとする．このとき，標本抽出に関する問題点を述べよ

問題点が分からないのです。

243

： １３２人目の素数さん [sage] 2011/07/02(土) 16:46:06.51

統計学受講者の家賃の分布をみるのが目的なら
妥当なサンプリング数とれば問題ないんじゃねえの

244

： １３２人目の素数さん [sage] 2011/07/02(土) 16:46:07.13

無作為抽出ではない。

245

： １３２人目の素数さん [] 2011/07/02(土) 19:06:32.52

>>243

母集団を変えるということね。

>>244

「統計学受講者の自宅外学生」の家賃は、
正規分布かどうかはわからないってことね。

246

： １３２人目の素数さん [sage] 2011/07/02(土) 19:48:58.36

というか、前期の宿題かもしれないんだから、少しは放っておけ。

247

： １３２人目の素数さん [] 2011/07/02(土) 20:03:55.60

宿題かもしれないけど、
このスレなかなか伸びないから。

何か書きたくなるわけ。

>>246

さんがいろんなこと書いてくれ。

248

： １３２人目の素数さん [sage] 2011/07/03(日) 09:20:08.35

確かに正規分布してるものなど存在しないが
統計学は正規分布してると思い込まないと成り立たない

249

： １３２人目の素数さん [sage] 2011/07/03(日) 12:25:12.13

>>248

ん？

中心極限定理を誤解してないか。

250

： １３２人目の素数さん [sage] 2011/07/03(日) 12:29:50.66

余計なお世話かもしれないけど、
正規分布している
という表現止めた方がいいよ。
正規分布に従っている
の方がいいよ。

先日、frpのメーリングリストでも標本数という言葉が問題になったけど、
言葉は正しく使おうよ。

帰無仮説を採択する
という表現のある教科書を排除しようと、図書館でうろついていたら、
あまりにも該当する本が多くて、頭が痛くなってきた。

251

： １３２人目の素数さん [sage] 2011/07/03(日) 12:58:10.15

>>248

正規分布表なめんな

252

： １３２人目の素数さん [sage] 2011/07/04(月) 16:15:44.16

>>242

その先生は統計学取ってる学生はビンボーだと思ってるんじゃないの。
断固抗議すべき

253

： １３２人目の素数さん [sage] 2011/07/04(月) 18:57:00.67

統計学受講者

そんなの全数調査しろよって言ってやれ

254

： １３２人目の素数さん [sage] 2011/07/04(月) 22:57:16.30

統計学の問題がわかりません。（確率密度関数、期待値など・・）

全くわからないんで教えてください。
あるバス亭での発車時刻は毎時5分、１５分、３５分、５０分となっている
このバス亭に発車時刻を知らずにきた人が発車まで待つ時間をＸ分とする

(a)Ｘの確率密度変数を求めよ
(b)Xが１０以上となる確率を求めよ
(c)Ｘの期待値を求めよ。。

おねがいいたします。。

255

： １３２人目の素数さん [sage] 2011/07/05(火) 08:29:05.22

>>254

教科書に書いてある、確率密度関数と期待値の定義を書いてください。
で、どこがわからないか聞いてください。

256

： １３２人目の素数さん [] 2011/07/05(火) 19:40:00.31

誰か授業の問題演習の答え教えてください　手も足も出ません　謝礼払います
詳しくはtedted_002@mail.goo.ne.jpまで　捨アドです

257

： １３２人目の素数さん [] 2011/07/05(火) 19:49:39.94

昭和3年1月関東州大連市生まれ。
昭和28年3月京都大学理学部植物学科卒業。
昭和32年9月大阪市立大学理工学部助手。

258

： １３２人目の素数さん [] 2011/07/05(火) 19:57:59.30

あげとくわw

259

： 猫は卑屈 ◆MuKUnGPXAY [age] 2011/07/05(火) 20:40:40.52

南部陽一郎先生、西島和彦先生や梅棹忠夫先生に嫉妬した当代きっての
馬鹿男ですね。もし嫉妬スルにしても相手が完全に違うと思いますけど。

まあお気の毒な事で。

猫

260

： １３２人目の素数さん [] 2011/07/05(火) 20:47:44.70

増田芳雄さんは世界的な植物学者ですよ
そんなことも知らないのか

261

： 猫はオッサン ◆MuKUnGPXAY [age] 2011/07/05(火) 21:08:53.48

>>260

そんなツマラナイ事は私は知りませんね。でも『もし世界的』というの
であれば客観的に認められる証拠を提出して下さいまし。何も知らない
ド素人が騙されて貴方の主張を鵜呑みにしたらとても困りますから。

猫

262

： 猫はオッサン ◆MuKUnGPXAY [age] 2011/07/05(火) 21:15:15.90

>>260

そもそもその人はどんな研究で業績を挙げた人なのでしょうか？　貴方
が『世界的である』という主張をスルのであれば、ソコは貴方がきちん
と責任を持って説明をしなければなりません。

お返事をお待ちします。

猫

263

： １３２人目の素数さん [] 2011/07/05(火) 21:23:42.15

君に質問権はないよ

264

： 猫はオッサン ◆MuKUnGPXAY [age] 2011/07/05(火) 21:27:46.23

>>263

では今後は私は貴方に対して徹底的に喰い下がり、執拗に追跡を行います。
なお

>>260

に記述がアル主張を私が認める事は絶対にアリマセン。

猫

265

： 猫はオッサン ◆MuKUnGPXAY [age] 2011/07/05(火) 21:31:23.28

>>263

『何故私には質問権がないのか』を論理的に説明願います。お返事をお待
ちします。

猫

266

： 東大生 [AGE] 2011/07/06(水) 07:57:14.12

昭和3年1月関東州大連市生まれ。
昭和28年3月京都大学理学部植物学科卒業。
昭和32年9月大阪市立大学理工学部助手。

この経歴の偉大な生物学者は誰ですか？

267

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 11:09:02.78

>>266

東大生サン、

現代数学の重要性とその展望に関する談話を迅速にお願いします。貴方
のその『豊富な知識と深い理解』が行かされる瞬間ですから、我々下々
に希望の光を貴方の知性で与えて下さいまし。

猫

268

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 11:10:40.57

>>266

経歴は偉大でも頭はカラッポ、知性は皆無。井の中の蛙。

猫

269

： １３２人目の素数さん [] 2011/07/06(水) 12:53:58.45

>>266

ん、25歳で大学卒業？
芳雄さんは浪人とか留年してたの？

270

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 13:24:55.91

>>269

芳雄サンって誰や？

猫

271

： １３２人目の素数さん [sage] 2011/07/06(水) 13:31:21.43

>>269

京都大学が昭和24年から新制大学になったのを機会に進学したのでは？
戦争からまもない昭和21～22年は進学できる状況でなくても不思議はないし
昭和23年に進学した人は学制改革で放り出されて新制大学再受験が必要でした。

学制改革
外部リンク

ttp://ja.wikipedia.org/wiki/%E5%AD%A6%E5%88%B6%E6%94%B9%E9%9D%A9

272

： １３２人目の素数さん [] 2011/07/06(水) 13:37:01.04

へぇ、芳雄っちは苦労したんやな～

273

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 13:41:39.00

幾ら苦労しても能力が無ければ馬鹿のまま。そういう人が息子の教育を
スルのは誤り。そもそも「ああいう不見識」は子供を持つべきではない。

猫

274

： １３２人目の素数さん [] 2011/07/06(水) 13:45:00.37

芳雄っちは京大卒業かすごいなぁ
息子は阪大らしいが…

275

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 14:11:13.86

ハハハ、京大は凄いんですか。ほんで阪大は何なんですかね～

猫

276

： １３２人目の素数さん [] 2011/07/06(水) 14:14:55.12

京大＞阪大だから、芳雄さんのほうが優れていますね

277

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 14:18:16.16

>>276

その芳雄サンって誰や？　アホの見本かァ？

猫

278

： １３２人目の素数さん [] 2011/07/06(水) 14:20:12.81

>>277

君に質問権はないよ

279

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 14:43:13.55

>>276

その芳雄サンっちゅうんは誰や？　馬鹿の見本かァ？

猫

280

： １３２人目の素数さん [] 2011/07/06(水) 14:45:56.69

>>279

人類史上例をみない天才かつ努力家の見本だよ

281

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 16:33:58.04

>>280

そうですか。何十年にも亘って身内からの攻撃に耐えて生き長らえた、
という様な事なんですかね。まあ頭が極端に悪くても、でも馬鹿な努力
だけは出来た、という様な事ですかね。猪突猛進の阿呆。

猫

282

： 東大生 [AGE] 2011/07/06(水) 18:35:54.34

だからその努力家の息子は痴漢ということでいいんですね？

283

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 18:44:22.21

>>282

東大生サン、

現代数学の重要性とその展望に関する有難いお話しを賜わりたく存じます。
その溢れんばかりの知性と教養に裏打ちされた『豊富な知識と深い理解』
を是非ともこの場でご披露なさって下さいませ。

お返事をお待ち申し上げまする。

猫

284

： 猫は虚偽院生を叩く ◆MuKUnGPXAY [age] 2011/07/06(水) 19:02:27.56

>>282

東大生サン、

スマートでカッコイイお返事をお待ち申し上げます。是非とも頭がキレ
る所をこの場で我々下々にお見せ下さいませ。

猫

285

： １３２人目の素数さん [] 2011/07/06(水) 20:38:20.54

なんで学部学生に粘着しているのか？
学部生に現代数学なぞ触れた事もないだろ？

286

： １３２人目の素数さん [sage] 2011/07/07(木) 23:51:10.60

>>276

昨夜のＮＨＫ「ためしてガッテン」に、狩野裕阪大教授が登場しておりましたね。
広告で見かける「お客様満足度98%」等の統計のトリックを解説していました。
いわく「サンプルの偏り」に要注意と。
応用統計学に関しては、京大＜＜阪大じゃないのかな？
ためしてガッテン　数字トリック見破り術　ゲスト：狩野裕阪大教授
外部リンク

ttp://www9.nhk.or.jp/gatten/archives/P20110706.html

287

： １３２人目の素数さん [sage] 2011/07/08(金) 00:26:13.20

>>286

まてまて。
当たり前の内容をテレビで話しただけで大学に差をつける根拠にしちゃだめでしょ。

288

： １３２人目の素数さん [sage] 2011/07/08(金) 00:46:39.33

サンプルはためしてガッテンだけですが何か。

289

： １３２人目の素数さん [sage] 2011/07/08(金) 01:07:40.48

>>288

そのサンプルは適切なのかね？

290

： １３２人目の素数さん [] 2011/07/09(土) 15:26:33.82

文系の学部の数理統計の練習問題がとけなくてこまってます　3万円払うので
誰か教えてください　詳しくはtedted_002@mail.goo.ne.jp

291

： １３２人目の素数さん [] 2011/07/19(火) 22:17:27.68

統計学できる人、誰か居る？

292

： １３２人目の素数さん [sage] 2011/07/19(火) 22:39:09.94

なんかよう？

293

： １３２人目の素数さん [sage] 2011/07/19(火) 23:50:42.12

>>286

狩野裕教授の学科が、統計学の助教を公募中のようですね。
＝＝大阪大学大学院基礎工学研究科助教公募（統計学）のお知らせ＝＝
１．公募人員：　助教１名
２．勤務形態：　常勤　任期なし
３．所　　属：　大阪大学大学院基礎工学研究科・システム創成専攻・数理科学領域・
　　　　　　　　　　統計数理講座（基礎工学部情報科学科数理科学コースを兼担）
４．研究分野：　統計科学・数理統計学
５．希望する人材：　熱意をもって教育・研究にあたり，統計数理・数理科学の発展に
　　　　　　　　　　　　貢献して下さる方を求めます．数学・統計学の演習科目と計算機を
　　　　　　　　　　　　使った実習科目等を担当して頂きます．
６．応募資格：　博士の学位を有する方，または研究上の業績がこれと同等以上と認められる方
７．着任時期：　平成２３年１０月１日以降のなるべく早い時期
９. 応募締切：　平成２３年８月１８日（木）必着
外部リンク

ttp://www.es.osaka-u.ac.jp/grad/announce/index.html#74

294

： １３２人目の素数さん [] 2011/07/20(水) 00:32:46.10

>>213

>④Bの母平均の点推定値及び95%信頼限界を・・・・・
この例題って、以下の２点が訝しいんだが。
A因子を４水準も採っているが、普通は3水準で十分だろ？
A,B各因子の母平均の推定値を求めよ．．．とあるが、求めるべきは、
特性値(収率)を最適値にする因子組合わせでの収率の点推定と区間推定値だろ？
この配置実験計画法例題は、何という科目で出題された問題なの？

295

： １３２人目の素数さん [] 2011/07/20(水) 02:19:23.82

>>292

すまん解決した。。。

296

： １３２人目の素数さん [] 2011/07/25(月) 12:51:46.80

統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか
分かる人いたら教えてください。

297

： １３２人目の素数さん [] 2011/07/25(月) 13:19:23.53

統計ソフト、JMP 8使ってるんですが、Mac のOSをLionにアップしていいものか
分かる人いたら教えてください。

298

： １３２人目の素数さん [sage] 2011/07/25(月) 13:19:35.43

マイナーなOSだから、開発元に問い合わせたほうがいい。

299

： １３２人目の素数さん [] 2011/07/25(月) 15:11:09.60

>298
296/297です。（すみません、ダブルで書き込んでました）
開発元は、JMP9しかサポートしてなくてJMP8はサポート外だとバッサリ切られました。
もし情報お持ちの方がいたら教えてください。

300

： １３２人目の素数さん [] 2011/07/25(月) 15:11:37.55

301

： １３２人目の素数さん [sage] 2011/07/25(月) 15:12:52.74

JMP 9を購入するか、Rをインストールしろよ

302

： １３２人目の素数さん [] 2011/07/25(月) 16:10:33.64

>301
自分のPCであればすぐにJMP9にするのですが、PC自体がラボの所有なのですぐには出来ないのです。

303

： １３２人目の素数さん [sage] 2011/07/25(月) 17:32:58.91

>>302

ラボのMacなら勝手にLionにしたらダメだろ

304

： １３２人目の素数さん [] 2011/07/25(月) 17:59:49.07

>303
すみませんが、僕の質問とは論点がずれています。

どなたかOSX Lion + JMP 8 の動作確認していたら教えてください。

305

： １３２人目の素数さん [sage] 2011/07/25(月) 23:45:43.59

>>304

MACの会議室に移動した方が早いと思うよ。

ttp://hibari.2ch.net/mac/#2

306

： １３２人目の素数さん [] 2011/07/26(火) 13:27:58.02

>>304

動くよ。

307

： １３２人目の素数さん [sage] 2011/07/26(火) 18:54:47.30

マカーってほんと馬鹿だな。

308

： １３２人目の素数さん [sage] 2011/07/26(火) 23:48:42.61

悪いのはマカーじゃなくてMACなんだよ。
みんな騙されてるだけなんだ。
目を覚ましなよ！

309

： １３２人目の素数さん [sage] 2011/07/27(水) 05:18:35.80

MACで統計学とか統計学を馬鹿にしてるとしか思えない。

310

： １３２人目の素数さん [] 2011/07/27(水) 10:03:01.77

内挿（interpolate）と外挿(extrapolate)の違いって何ですか？

311

： １３２人目の素数さん [sage] 2011/07/27(水) 10:05:32.04

補間と補外のとか？

312

： １３２人目の素数さん [sage] 2011/07/27(水) 11:08:46.17

>>309

SASのJohn Sallに同じこと言ってみろ！

313

： 蛙-かわづ- ◆NxYIfSaetA [] 2011/07/29(金) 14:45:25.73

あんでぃ、早く。

314

： １３２人目の素数さん [sage] 2011/07/31(日) 08:43:20.56

1000頭の牛がいたとして汚染牛が混じってないかチェックするには何頭検査すればいいの？

315

： １３２人目の素数さん [sage] 2011/07/31(日) 08:59:39.82

>>314

確率（どれくらい間違ってもいいか）を何%以下にしたいかで変わってくる
けど、ゼロにしたかったら全部調べるしかないよ。

抜き取り検査だと、検査した個体に汚染された牛がいても残りにはいない
可能性があるし、逆に検査した個体に汚染された牛がいなくても残りには
いる可能性がある。

この場合の確実な方法（絶対に流通する牛に汚染されたものがいない方法）
は、出荷しようと思う個体を全て調べて、汚染されていない個体を出荷する
こと。

316

： １３２人目の素数さん [sage] 2011/07/31(日) 11:16:26.73

>>315

統計学的にはそうだけど、実践的には、「検査は100%正しく結果を出す」という前提が間違いだから、
検査の感度と特異度を考慮しなくてはならない。

317

： １３２人目の素数さん [sage] 2011/07/31(日) 17:38:51.38

統計学でも検査のすり抜けはもちろん考えるよ。
ただがん検診とかと違って放射性物質汚染の方が
確度は高いだろう。そもそも315は全頭検査と言っているのだから
がん検診のように2回以上検査しろっていうのか？

318

： １３２人目の素数さん [sage] 2011/07/31(日) 19:10:54.46

図書館のPCの利用率が
①8：00～9：30　79％
②9：30～11：00　81％
③11：00～12：30　84％
④12：30～2:00　63％
⑤2:00～3:30　78％
のとき④の時間帯は利用率が低い・有意差があるというには何検定を使うのが妥当ですか？
実際には①～⑤に分かれているのではなく、15分刻みの16個に分かれているのですが・・・

319

： １３２人目の素数さん [sage] 2011/08/02(火) 11:53:30.79

全利用者とサンプルはそれぞれ何人くらいいるんだ？
全数調査か？

320

： １３２人目の素数さん [sage] 2011/08/02(火) 13:19:15.44

利用者じゃなくてPCの台数ベースの全数調査じゃないの

321

： １３２人目の素数さん [] 2011/08/02(火) 19:36:58.24

比率の差の検定で多重比較の検定はありますでしょうか。

成功か失敗かの実験で、n=30で、
条件A　成功率80％、条件B　成功率70％、条件C　成功率50％　で
α＝0.05で多重比較を行いたいのです。

322

： １３２人目の素数さん [sage] 2011/08/03(水) 01:15:45.18

＞＞３１７
なるほど利用率てのはPCの稼働率のことなのか

323

： １３２人目の素数さん [sage] 2011/08/03(水) 09:58:59.92

>>321

特に比率と考える必要もないと思います

324

： １３２人目の素数さん [] 2011/08/03(水) 13:21:37.00

>>318

PCの台数はわからないの？

325

： １３２人目の素数さん [sage] 2011/08/03(水) 17:15:04.05

PCの台数は書かれてないけど、％出してるわけだから時間帯毎に全何台中
何台稼働ってデータがあるわけでしょ。要するに検定の必要なし。

326

： １３２人目の素数さん [sage] 2011/08/04(木) 15:56:01.73

>>305

紹介されたmac板　ttp://hibari.2ch.net/mac/にJMPスレなんぞ、見あたらないぞ。
そもそもまともな統計家は、Macなんぞ使わないのでは？

327

： １３２人目の素数さん [sage] 2011/08/04(木) 18:53:05.65

>>326

JMPってわざわざMac向けに開発されたパッケージ。

328

： １３２人目の素数さん [sage] 2011/08/04(木) 19:10:35.68

どおりで旧バージョンのサポートをあっさり捨てるんだな。
アップルと同じだな。

329

： １３２人目の素数さん [sage] 2011/08/04(木) 19:17:58.83

>>328

ただし現在のユーザー人口は圧倒的にWindowsってSASの人がセミナーで言ってた。

330

： １３２人目の素数さん [sage] 2011/08/04(木) 19:36:30.39

Adobeと同じだな。

331

： １３２人目の素数さん [sage] 2011/08/05(金) 07:12:44.95

>>326

JMPの専用のスレがあるってことじゃなくて、MAC使いが少ない
ここで聞くよりもMAC使いに聞いた方が早いんじゃないかってこと。

332

： １３２人目の素数さん [sage] 2011/08/05(金) 11:23:12.13

>>327

そうかあ、JMPってマウス機能なんかが他のWindows用ビジネスアプリとは毛色が
違うなと感じていたんだが、元々はExcel同様にMAC用に開発されたアプリだった
のか。出生地がMAC環境だったんだね。

333

： １３２人目の素数さん [sage] 2011/08/05(金) 21:07:35.70

SPSSもSASもツイッターやってんだな

外部リンク

ttp://twitter.com/#!/spssjapan
外部リンク

ttp://twitter.com/#!/SASJapan

334

： １３２人目の素数さん [sage] 2011/08/06(土) 02:43:08.18

わかる人教えてください

Aという細胞郡とBという細胞郡を用意します。

それに対して薬品CとDで処理をしてある値を３回ずつ計測します。

つまり　AC１　AC2　AC3　BC1　BC2　BC3　
　　　　AD1　AD2　AD3　BD1　BD2　BD3　

という実験結果をえます。

それぞれ３回ずつの値の平均　μAC＝（AC1＋AC2＋AC3）/3　として

平均のRatio　RA=μAC/μAD　　　　　RB＝μBC/μBD　と定義します。

この平均の比率　RAとRBについて優位差検定をしたいのですが、そのような検定方法はございますでしょうか？

教えてください。

335

： 334 [sage] 2011/08/06(土) 05:41:55.83

補足

薬品CとDは濃度が違うだけで同じ薬品です。

なので比を取っています。

336

： １３２人目の素数さん [] 2011/08/06(土) 13:59:09.69

>>334

「フィッシャーの正確確率検定」
でググってみてください。

337

： １３２人目の素数さん [sage] 2011/08/06(土) 21:04:36.39

>>332

JMPといえば、慶應大の公認データ解析ソフトですね。SPSS

>>333

より、有能なの？

ttp://www.dsci.sfc.keio.ac.jp/

338

： １３２人目の素数さん [sage] 2011/08/06(土) 23:00:46.81

マウスを多用する解析が好ましいと感じる人がいるようだ。
MAC好きと同じだな。

339

： １３２人目の素数さん [] 2011/08/07(日) 00:56:23.84

MAC好きって馬鹿が多いよね。
なぜだろう？

340

： １３２人目の素数さん [] 2011/08/07(日) 01:15:09.39

米農家を侮辱した東海テレビにあの方がお怒りのようです

外部リンク

ttp://www.youtube.com/watch?v=FSzRjnq9boY&feature=related

341

： １３２人目の素数さん [sage] 2011/08/09(火) 17:38:47.29

>>339

自分の周囲を見てると分からないでもないが、p=0.1くらいの主張だな。

342

： １３２人目の素数さん [sage] 2011/08/10(水) 21:57:18.84

>>334

何か難しいこと考えるんだね
自分なら、細胞の種類(ダミー)と薬品の濃度、その交互作用を独立変数にして
「ある値」を従属変数にして回帰分析。
交互作用が有意なら細胞によって薬品に対する反応が異なる、つまり、あなたの言葉で言うRAとRBに差がある。
有意でないのなら差はない。
といくかな。
交互作用が「比」に相当するとしてよいように思うけど。

343

： １３２人目の素数さん [sage] 2011/08/13(土) 22:15:03.93

カイ２乗検定で

帰無仮説H0：～と～は独立だ
対立仮説H1：～と～は独立でない

としてH0を棄却して独立でないことを示す例が多いけど、

逆はできないんだよね？
つまり独立でないことを帰無仮説として、
カイ２乗統計量が小さいことを根拠に帰無仮説を棄却し、
独立であることを示すってことは無理だよね？

344

： １３２人目の素数さん [] 2011/08/15(月) 10:26:41.77

独立でない、と仮定したときの貝2錠推計量をどうやって計算するつもりなんだ？？

345

： １３２人目の素数さん [sage] 2011/08/15(月) 14:28:39.87

こういうことじゃないの。

外部リンク

ttp://aoki2.si.gunma-u.ac.jp/lecture/mb-arc/one-two.html
の1.1の最後の方にある
もう一つ付け加えておく。比率の差をχ2 分布を用いて検定するときに，左側の例えば 0.05% は何を意味するであろうか。
それは，「偶然とは思えないほど差がない」ということである。これは比率の差の検定ではあまり取り上げられないが，
適合度の検定（これも比率の差の検定としても解釈できる）の場合には「データがねつ造された可能性」を示唆するものとして
取り上げられることがある。すなわち，χ2 分布の左側は「理論に一致しすぎる」，右側は「理論と乖離しすぎる」ということである。
中庸がもっともあり得るという立場から検定すれば，「χ2 検定の場合にも両側検定はあり得る」。
(適当に改行)

346

： １３２人目の素数さん [sage] 2011/08/15(月) 15:11:19.49

>>345

>中庸がもっともあり得るという立場から検定すれば，「χ2 検定の場合にも
>両側検定はあり得る」

って一般的な考え方かな？

347

： １３２人目の素数さん [] 2011/08/15(月) 17:34:26.01

>>339

>>341

私の周りでもそうだから、
P=0.9になってしまうね。
反論はないのかな？

348

： １３２人目の素数さん [sage] 2011/08/15(月) 19:34:02.90

>>347

私の周りでもそうだからp値が小さくなるって言わなきゃいけないんじゃないの

349

： １３２人目の素数さん [sage] 2011/08/15(月) 20:04:14.93

>>346

一般的じゃない。
対立仮説として「データ捏造」をさらに加えた時の話だよね。
どんな検定基準を作っても、捏造者はそれをクリアーしてくる。
なので「データ捏造」は統計学の枠には入らない

350

： １３２人目の素数さん [sage] 2011/08/17(水) 19:47:15.88

基準を知られたら何でも無理なのは確か。
ただ過去の捏造話では簡単に見破れるほどひどいのが多いけどね。
（見破られていない完全犯罪的な捏造があるのかもしれんが）

351

： １３２人目の素数さん [sage] 2011/08/23(火) 23:23:46.04

ついでにχ^2検定について１つ質問

m*nの分割表の自由度は(m-1)(n-1)で計算になるというのは分かるのだけど、
7*2の表と4*3の表の自由度が6となって
推計量が同じ分布に従うことが納得いかない。
分かりやすい説明ない？

352

： １３２人目の素数さん [sage] 2011/08/24(水) 00:19:25.41

計算は理解しているのになぜ納得いかないかが分からない。

353

： １３２人目の素数さん [] 2011/08/24(水) 13:44:37.19

＞自由度は(m-1)(n-1)で計算になるというのは
＞　　「　分　か　る　」　
＞のだけど

　
　　　↓

＞7*2の表と4*3の表の自由度が6となって同じが　納得いかない。

本当に　分かっているとは　思えない。
つまらん見栄、はるなよ。

354

： １３２人目の素数さん [sage] 2011/08/24(水) 18:54:14.87

自由度の「式は知ってる」と言いたかったんだろう。意味じゃなくてね

355

： １３２人目の素数さん [sage] 2011/08/24(水) 22:58:06.11

SBICが資料によっていろいろ違ってるような気がする

356

： １３２人目の素数さん [sage] 2011/08/24(水) 23:08:12.92

>>352-

>>354

そうです。
計算式は知ってるけど意味が分かりません

357

： １３２人目の素数さん [sage] 2011/08/25(木) 00:49:17.27

分割表は周辺固定。なんで1引くのか考えてみてよ。

358

： １３２人目の素数さん [sage] 2011/08/25(木) 06:43:36.03

ヒント：以下の２×２分割表の(1)(2)(3)欄を x の式で表しなさい。
　　　　　　　　　　　　計
　　　　x　　　 (1)　　 10
　　　 (2)　　　(3)　　 40
計　　20　　　30　　　50

359

： １３２人目の素数さん [sage] 2011/08/25(木) 17:59:49.85

知っている人がいたら教えて欲しいのですが
シェッフェの一対比較法で
-2から2の5点系や-3から3の7点系は見るんですが
-1から1の3点系ってあるんですか？

360

： １３２人目の素数さん [sage] 2011/08/25(木) 23:22:58.14

>>358

だから、計算は知ってるんだって。

361

： １３２人目の素数さん [sage] 2011/08/25(木) 23:37:28.87

>>360

だから、

>>358

をみると、２×２の場合には１個情報が与えられてしまえば
他の情報は決定されてしまう。つまり自由に決めれる自由度が１個。

その考え方を、

>>351

の７×２と４×３にも当てはめて見れば、自由になる数
の個数はどうなる？

362

： １３２人目の素数さん [sage] 2011/08/25(木) 23:39:56.81

>>361

その自由になる個数の数ってのは分かってるよ。
計算式の途中で7*2は14項、4*3は12項出てくるじゃん。
それが各項が独立ではないから自由度6のカイ２乗分布に従うんだろうってことは分かるけど、
直感的に違和感を感じるから詳しい人に説明してもらいたいんだよ。

363

： １３２人目の素数さん [] 2011/08/26(金) 13:21:18.15

こんなことで、直感的に違和感を感じる人には
　統計学は無理じゃないかな。。。
　
　普通、直感的に理解できることなので…
　

　

364

： １３２人目の素数さん [sage] 2011/08/26(金) 21:13:14.73

具体的に数式を変形して
(～)^2 + (～)^2 + (～)^2 + (～)^2 + (～)^2 + (～)^2
の形に変型して見せてよ。

違和感感じてるの項数だけなんだから。

あと、学問として統計学をやっていこうという気はないです。
ただのツールなので。

365

： １３２人目の素数さん [sage] 2011/08/26(金) 22:52:34.40

>>364

ただのツールなら、それこそ気にしなくていいよ。

それに、ただのツールと言う人のために時間を割いて書き込みしても無駄でしょう。

366

： １３２人目の素数さん [sage] 2011/08/26(金) 23:01:45.70

信用して使えるものなのか気になる

367

： １３２人目の素数さん [sage] 2011/08/27(土) 00:07:00.15

>>366

そういう点が気になるなら、「学問」として自分で勉強しましょうね。

368

： １３２人目の素数さん [sage] 2011/08/27(土) 00:10:12.47

2*2の場合、とてもきれいな公式があったので、
それより大きな表の場合を知りたかったのですけどね。
私の計算力では無理でした。
残念です。

369

： １３２人目の素数さん [] 2011/08/27(土) 09:17:42.05

JUMPかRで、三群以上の実験データについて比率の差の検定の
多重測定はできますでしょうか

370

： １３２人目の素数さん [sage] 2011/08/27(土) 09:19:37.91

できます。

371

： １３２人目の素数さん [sage] 2011/08/27(土) 11:24:16.89

>>368

は

>>351

かな？
最初から、
「2*2で自由度についてこういう展開式があってわかりやすいんだけど、
3*4とか7*2みたいな場合はどうなるのかわかるひといるかな。
私の計算力では無理だった」
と書けば答えてくれた人もいると思う。

質問の仕方と受け答えを間違ったね。

372

： １３２人目の素数さん [sage] 2011/08/27(土) 23:21:53.41

あのう、立教明治スレからやってきた者です。
ぜひ皆さんのお力を借りたく参りました。
どうしても立教明治ダブル合格のデータの持つ意味に納得が行かないので
相談しています。
結果の数値は事実なので問題ではありません。
でもこの調査結果から明治より立教が秀逸とは言えないと思います。
なぜなら、そもそもの調査対象データに偏り、というよりデータの取り方に問題が
あると思うからです。

皆さまには、この立教明治ダブル合格者のデータの信憑性について、あるいは適切な
参照方法についてご教授いただきたけないでしょうか？

373

： １３２人目の素数さん [sage] 2011/08/28(日) 00:08:35.73

少なくとも2×2分割表で納得できたのなら、もう気は済んだでしょう。

これは結構難しい問題で、最初はトップの専門家が皆間違えてた。
その誤りを指摘して、今日使われている自由度の式を導いたのが、R.A.Fisher。
これでデビュー後、次々と精密理論を作り上げて行った。

R.A.Fisher, "On the Interpretation of X2 from Contingency Tables, and the Calculation of P,"
Journal of the Royal Statistical Society, Vol.85, No 1(1922), pp 87-94.

374

： １３２人目の素数さん [sage] 2011/08/28(日) 00:31:57.95

>>372

立教と明治の両方に合格した人がどっちを選んだかという話？
データ例を挙げて、どんな偏りがありそうなのかを説明してみれば、
統計的な問題がありそうかどうかわかると思うけど

375

： １３２人目の素数さん [sage] 2011/08/28(日) 01:22:45.61

>>372

とりあえず、データ見せてよ。

君が持ってるデータをみんなが持っているわけじゃないし、
そんな聞き方じゃ、わざわざ探す気にもならないよ。

376

： １３２人目の素数さん [sage] 2011/08/28(日) 01:35:59.22

>>374

>>375

ありがとうございます。
コピペしますので、もうしばらくお待ちください。

377

： １３２人目の素数さん [sage] 2011/08/28(日) 01:58:07.02

週刊誌の受験特集でダブル合格者の進学データがあります。
一例を挙げると以下のようなものです。

1 エリート街道さん 2009/02/18(水) 13:47:33 ID:BtFc0u57
読売ウィークリー08.8.3号「Ｗ合格者対決特集」
～Ｗ合格時の進学先～
[対明治]　　　　　　　　　　　　　　　　[対青学]
○立教法　 42 - 27●明治法　　　　○立教法　 11 - 0●青学法　
○立教法　　7 - 4●明治政経　　　○立教経済　7 - 1●青学経済
○立教経済19 - 4●明治商　　　　 ○立教経済　4 - 0●青学国際政経
○立教経済16 - 0●明治経営　　　○立教経営　5 - 0●青学経営
○立教経営34 - 3●明治経営　　　○立教文　 31 - 5●青学文
○立教経済37 - 14●明治政経　　　○立教理　　8 - 1●青学理工
○立教文 102 -28●明治文
○立教理　48 - 5●明治理工
[対学習院]
○立教法　 10 - 0●学習院法　　　　　※[対中央][対法政]は問題外、掲載すらされず
○立教経済13 - 1●学習院経済
○立教文　 23 - 4●学習院文
○立教心理 4 - 1●学習院文
○立教理　 14 - 2●学習院理

■アエラ09.2.23号併願対決
～○立教全体平均70-明治全体平均30●～
○立教経営85-15明治商●
○立教経営89-11明治経営●
○立教文68-32明治文●
○立教心理55-明治文46●
※立教心理は新座、明治文は御茶ノ水

●立教法10-中央法90○
●明治法4-中央法96○

378

： １３２人目の素数さん [sage] 2011/08/28(日) 01:58:27.91

この表ではマーチ各校の勝敗をダブル合格者の進学数によって決めています。
この調査で明らかなのはダブル合格者の進学者の数であって、その大小を示した
に過ぎません。
多くのスレッドではあたかもWinnerの大学の方が人気があり、優れていることの
裏付けのように扱っています。たしかにダブル合格者にとってはその通りです。

ですが、両校の受験者の合計と比較してダブル受験者数があまりに小さい場合、
ダブル合格者のもたらす結果は補正して見る必要があると考えます。

統計学に精通されている皆さまなら、私の申しあげたことの趣旨を汲み取って
いただけるのではないかと思い、こちらに書き込みさせていただきました。

立教明治スレであまりにも酷い解釈がまかり通っており、皆さまからの助言を
期待するものです。

379

： １３２人目の素数さん [sage] 2011/08/28(日) 02:11:46.99

少し本音ベースで話すと私は明治の出身です。
このダブル合格者の進学データを見たとき、正直無意味と思いました。
多分高校3年のときだったと思います。
なぜなら両校を受験しているという条件が一般的ではない、その他のケースの
方が圧倒的に多いだろう、と思ったからです。

実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人は
いませんでした。彼女も明治ですが、やはり女友達にもいなかったそうです。
なので明治入学者のほとんどは立教を受験していないと考えます。
ですから、立教と明治のダブル合格者の進学データについては明大生一般の実状と
異なるものと考えます。
明治ではよくこう言われます、「そもそも立教青学は受けない」と。
理由は偏差値の差以上に校風のベクトルが違い過ぎるからです。
明大生は早稲田、公立大落ちがほとんどです。

380

： １３２人目の素数さん [] 2011/08/28(日) 03:08:01.25

俺、早稲田だけど明治は受けなかったけど立教は受けたよぐらいしか言えない

381

： １３２人目の素数さん [] 2011/08/28(日) 03:59:35.07

＞　実際、明治に入学して友人に立教受験について訪ねると1人も立教を受験した人はいませんでした。

それは何人にたずねたのかな？
係属高校出身者を除いて１００人ぐらいにたずねていれば一応評価できるけど。

立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。
だから気にしないでいいと思う。

今の不景気な時代に私立大学に行くことは、裕福な家庭の子息にしか
できないことだからね。

勉強するのは旧帝や早慶にまかせておいて。
まったり遊んで卒業すればいいんじゃないの？

382

： １３２人目の素数さん [sage] 2011/08/28(日) 05:08:22.56

>>379

読売ウィークリーのデータがどれくらい信用できるかって問題はある。
08年くらいだと個人を特定できたんだっけ？
もしも、きちんと個人を特定してダブル合格をフォローできてるなら
立教と明治の両方を受かった学生は立教に行ってるのが多いくらいは
言えそう。

まあ、似たようなLVの大学を複数受けてるってことは、そのLVの大学が
適正LVで、そのために受験料も余分に出せるってことなので、お金がある
って意味では立教向きの属性はあるかも。

でも、どうでもいい数字だなと思う。
学生の雰囲気も違うし、入った大学が気に入ってればいいんじゃないの。

383

： １３２人目の素数さん [sage] 2011/08/28(日) 10:47:27.68

>>380

　やはり立教の方がいいということでしょうか、
それとも明治は早稲田コンプという雰囲気だから敬遠されたんでしょうかね。
ご回答ありがとうございます。

>>381

　周囲にはせいぜい20～30人くらいです。ですからほとんど主観の領域です。
付生には尋ねていません。

>立教も明治もどんぐりの背比べだから、おれから見たらあまり違いはないように思う。
>だから気にしないでいいと思う。

>勉強するのは旧帝や早慶にまかせておいて。
>まったり遊んで卒業すればいいんじゃないの？

私が主張したいのも、まさにこれらのことです。立教も明治も同レベル。
ただ両方受けた人にとっては立教が良かった、ただそれだけ。
もしくは明治はいやだった。ほとんど好みの問題で偏差値云々の話でないと
考えています。
私の考えでは、立教を併願するということは少しでも魅力を感じていたという
ことで、選択する可能性があります。一方私の持論である、明大生は立教を
受けていないという考えに立てば、ダブル合格者の進学データは、明治合格者の
スケールに比して極小となります。データとして偏りがあるということになります。
一応立教明治スレでも併願者数のデータを貼り付けてもらいました。
後程コピペします。

>>382

　ホントにどうでもいい数字なんです。
ぜひそのことを立教関係者の方に理解してほしいのです。

384

： １３２人目の素数さん [sage] 2011/08/28(日) 11:10:27.57

さきほの件です。古いデータですが各校の併願先がわかります。

887 エリート街道さん sage 2011/08/27(土) 22:30:11.29 ID:wvvB/703

>>877

はサンプルに偏りがあるけどね

明治立教を例にすると

①明治、立教にどちらも合格し、明治か立教に入学した
②明治だけ、立教だけに受験した合格した人は対象外
③明治、立教どちらも合格したが他の大学に入学したは対象外

2001年と古いが代ゼミの併願対決ではこうなってる
外部リンク

ttp://www.geocities.co.jp/CollegeLife-Lounge/6635/

明治法　　早大法1129　中央法1128　法政法840　立教法549★　日本法533　早大社518
明治商　　早大商*951　明治営*672　法政営654　明治政639　早大社575　立教経513★　中央商508
明治政　　早大社*818　早大商*805　明治商639　中央経562　早大政562　法政経508　明治営502　立教経477
明治文　　早大教*640　中央文*585　法政文583　早大文581　立教文491★　國學文417
明治理　　立教ランク外

立教文　　青学文*730　早大教697　上智文633　早大文623　学習文566　明治文491★　中央文386
立教経　　早大商1208　立教経952　早大社724　明治営621★　上智経568　法政営560　明治商513★　立教社510　早大政488　明治政477★　慶応経441
立教理　　理大理*389　中央理312　理理工247　上智理237　早大理233　青学理203　早大教154　学習理149　明治理130★
立教法　　早大法*714　明治法549★　中央法546　上智法470　法政法397　早大社366　立教経356　学習法319

385

： １３２人目の素数さん [sage] 2011/08/28(日) 11:12:08.44

877 エリート街道さん 2011/08/27(土) 21:47:18.40 ID:DkVmnfYc
具体的にサンプル数が判明しているソース

■私大併願対決「MARCH関関同立編」（AERA 2010年1月25日号）
外部リンク

ttp://iup.2ch-library.com/i/i0047294-1263749439.jpg
【マーチ編】　　　　　　　　　　　【関関同立編】
○立教２６６ - 　１２１明治●　　　○同大６１２- 　　３７立命●
○立教１５７ - 　　４６青学●　　　○同大４９５- 　　３２関学●
○立教１４９ - 　　５４中央●　　　○同大４６４- 　　　５関西●
○立教２６８ - 　　１２法政●　　　○立命１３９- 　１３４関学●
○明治２１０ - 　　８１青学●　　　○立命２４６- 　　５５関西●
○明治３１１ - 　１６９中央●　　　○関学３７３- 　　５５関西●
○明治５１５ - 　　１５法政●
○青学１０５ - 　　６０中央●
○青学２０６ - 　　３１法政●

386

： １３２人目の素数さん [sage] 2011/08/28(日) 11:20:14.21

で、この表を見易くしてくれたのがコレ。
明治立教の併願は387名。明治の単独受験者数は10万人以上。立教も数万はいる。一見サンプル抽出の手法を取っているかのように見えるが、明らかに立教明治の併願というのはレアケースと言える。果たしてそのようなデータに信憑性はあるのか？
そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。私はこの現状をなんとかしないと、と思ってる。

879 エリート街道さん 2011/08/27(土) 21:52:52.60 ID:DkVmnfYc
明治法政５３０人
明治中央４８０人
立教明治３８７人
明治青学２９１人
立教法政２８０人
青学法政２３７人
立教青学２０３人
立教中央２０３人
青学中央１６５人

明治・法政・中央はホーチミンで併願が多いのは当たり前
次に多いのが立教明治。立教法政も多い。
この辺は六大学だからか。

387

： １３２人目の素数さん [sage] 2011/08/28(日) 18:05:36.76

>>386

まず、2001年のデータは古すぎます。
10年前のデータをだしても現在の人気の変数にはなりません。

>そしてそのデータに翻弄され、受験生の適切な選択を妨げてはいないだろうか。
>私はこの現状をなんとかしないと、と思ってる。

って書いてるけど、別に受験生はそんなこと考えていないでしょ。
受かりそうな大学を併願してるだけ。

で、受かった後に、自分の大学を少しでもいいと思いたいから語ってるだけ。
ということで、君が気にしてるほど受験生は気にしてないし、ネットに書き込む
属性の人がそういってるだけなので放っておいていいと思います。

388

： １３２人目の素数さん [sage] 2011/08/28(日) 18:48:07.54

2010年のデータはどうですか？
また受験生に関しては私の勝手な想いですから気にしないでください。

これらの立教明治のダブル合格者の進学データは大学受験板、学歴板に大量に貼られ、そのたびに不毛な論争が続いています。どうにかこのダブル合格者の進学データの無意味さ(立教明治の優劣を決める上での指標という意味で)を証明したいと思うので、助言を下さい。

389

： 369 [] 2011/08/28(日) 22:12:52.11

>370 ありがとうございます。Rの場合のパッケージと関数を教えて頂けないでしょうか
よろしくお願いします

390

： １３２人目の素数さん [sage] 2011/08/29(月) 00:38:43.95

>>385

＞○立教２６６ - 　１２１明治●

全学部で　２：１　ぐらいの比だよね。率に直すと 69% ; 31%。
n = 387人だと、約20人以上の差がつくと5%有意なので、
この結果は「統計的に見て有意差あり」。

差が出る要因は
１．人数：一般入試合格者数の違い
２．学部学科構成（一方にあって他方にない学部学科の志望者数）
３．キャンパス・部活・宗教・就職先・・・
とか、もっと細かく見て行かないとわからない。
あと、併願同時合格者にもし女性が多いと、立教に行く率が高くなるかもね。

なので統計学ではなく、専門としてはマーケティングや社会学が近いかも。
けど一般常識としては、「これぐらいの差なら大体同ランクの大学」。

391

： 390 訂正 [sage] 2011/08/29(月) 01:21:17.60

×　約20人以上の差がつくと5%有意なので、
○　約40人以上の差がつくと5%有意なので、

（仮説 p=1/2 の下で √(np(1-p)) = √387 / 2 ≒ 10）

392

： １３２人目の素数さん [sage] 2011/08/30(火) 19:17:51.10

質問です。
tukeyの方法で30群(自由度270)を多重比較したいのですが、ステューデント化した範囲の表には10群までしか載っていません。10群以上は不可能なんでしょうか？
それとも補間する方法があるんでしょうか？
よろしくお願いします。

393

： (・゜ω゜・) ☆まじめこて☆ ◆rgujENbs.s [sage] 2011/08/30(火) 21:06:06.41

質問です。
変動係数の存在意義って何ですか？
標準化統計量を比較すればそれで事足りる気がするんですが。

394

： １３２人目の素数さん [sage] 2011/08/30(火) 22:54:37.40

>>392

可能です。
が、10までしかない表から30の場合を補間することはできません。

395

： １３２人目の素数さん [sage] 2011/08/30(火) 23:02:27.51

>>393

標準化統計量を比較するとは？
具体的に言うと、どういう数値を、何と何とで比較することを意味しているのでしょうか？

396

： (・゜ω゜・) ☆まじめこて☆ ◆rgujENbs.s [sage] 2011/08/31(水) 00:12:48.52

>>395

んーと、変動係数ってデータ集団の桁が違えば、
標準偏差の大きさが違ってくるから、
散らばりの程度を集団間で比較できないので必要と言う話ですよね？

それに対して標準化統計量って、ある特定のデータが
集団の中でどの辺りに位置しているかを表すわけですよね？
つまり、２つのデータ集団のデータを全て標準化して、
さらに２つのデータ集団ごとに標準偏差をとれば、
集団間の散らばりの程度を表現できますよね？という話です。

どうでしょう？

397

： １３２人目の素数さん [sage] 2011/08/31(水) 07:05:09.51

>>396

確かに、変動係数の存在意義は小さいと思いますが、それはさておき。

＞２つのデータ集団のデータを全て標準化して、
＞さらに２つのデータ集団ごとに標準偏差をとれば、

データの標準化というのは、「各々のデータから平均を減じて標準偏差で割る」ことでしょ？
いわゆるz得点というものですが。
そうすると、平均0、標準偏差1になりますから、もう一度標準偏差をとったら、当然1以外になりようがないでしょう。

ではなくて、A集団とB集団のデータを込みで平均と標準偏差を計算して、込みで標準化した後、
それぞれの集団ごとに集計して標準偏差をとるということですか？

たとえば、平均1で標準偏差0.1のA集団(アリ)と平均170で標準偏差10のB集団(ヒト)とを込みで標準化できると思いますか？
（まさに桁違いの場合)
計算はできますが、どういう意味をもつのでしょうか。

398

： 392 [sage] 2011/08/31(水) 11:38:48.13

>>394

ありがとうございます！
自由度と群数から範囲を求められるツールを手に入れたので、それでやってみようと思います。

399

： １３２人目の素数さん [] 2011/08/31(水) 13:02:53.38

lkjs6

400

： １３２人目の素数さん [] 2011/09/02(金) 00:27:21.39

質問です。
y=a+bx+eにおいて
aとbをＯＬＳで求めたとして、
その推計値はどの様な確率変数に従うか説明しろって言われたら
何て答えれば必要充分なんでしょうか？
サンプル数が多ければ正規分布、少なければｔ分布だと思うのですが
これだけだと説明になってないし・・・

401

： １３２人目の素数さん [sage] 2011/09/02(金) 09:17:39.66

>>400

ｔ分布は間違い（a, b の推定値とは違う話）。

＞はどの様な確率変数に従うか

問いとしては、誤差項の分布の「平均・分散」（と幾つかの標準的な仮定）を与えた時に、
「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨だと思う。
分布形は仮定せずに答えたあとなら、誤差項が正規分布に従うなら・・・とか付け足してもＯＫ

402

： １３２人目の素数さん [] 2011/09/02(金) 16:09:55.47

>>410

ありがとう御座います。

>「確率変数 a, b」の分布の「平均・分散」がどう表せるかを答えさせるのが主旨
ということは「a,bは不偏推定量であり、分散は～～の式で求めることが出来る」
とか書けばいいのでしょうか？

403

： １３２人目の素数さん [] 2011/09/02(金) 16:32:16.64

ちゃうやろ。

おそらく「ｔ分布に従う」、という答えを求められているぞ。

数学的に正確かどうかは別の話。

404

： １３２人目の素数さん [] 2011/09/04(日) 16:23:52.48

質問です。
ある計測をして、
1,2,3,3,4,4,4,5,5,5,5,6,6,6,7,7,7,8,9,300
という20個のデータが得られたとします。
このとき、けた外れに大きい300というデータを取り除いたり、この計測データには不適(測定ミス)だと判断できるような方法はあるでしょうか？
わかりにくい内容で申し訳ありませんがよろしくお願いします。

405

： １３２人目の素数さん [sage] 2011/09/04(日) 17:55:20.85

>>404

実際に測定ミスであったか否かの判定は統計では分からないです。
ただそれが外れ値、異常値であるという示唆は得られるので、それに従って
検証し直すことになります。測定ミス、入力ミスでない外れ値であるとなった
場合にそれを分析から除去するのか、別の処理をするのかは研究の内容にも
よるでしょう。

406

： １３２人目の素数さん [sage] 2011/09/04(日) 18:58:23.73

>>404

それが、計測ミスか入力ミスか外れ値かはわからないが
極端に外れているかどうかは、統計でわかるよ。

407

： 404 [] 2011/09/04(日) 19:13:12.26

>>405-406

ありがとうございます。
では300というデータが他のデータ群から極端に離れていることを客観的に示すためにはどのような方法で示せばよろしいでしょうか。
質問ばかりで申し訳ございません。

408

： １３２人目の素数さん [sage] 2011/09/05(月) 12:19:43.44

>>407

2chとWikipediaとどちらが信頼できるのか、
五十歩百歩だと思うが、Wikipediaを参照するのもよかろう
外部リンク

ttp://ja.wikipedia.org/wiki/%E5%A4%96%E3%82%8C%E5%80%A4

409

： 404 [] 2011/09/05(月) 20:30:08.99

>>408

わざわざありがとうございます!!
参考になります。

410

： 迷える学生 [sage] 2011/09/06(火) 00:46:15.99

こんばんわ正規分布と標準正規分布がいまいちわかりません。
標準正規分布は平均＝０　標準偏差＝１と言うのはわかりますが。
問題で工場の[平均５．２kg][標準偏差が０．１kg][５．０kg]未満の製品は社内で不合格とされるとでているのですが生産された製品の不合格率の割合が何パーかがわかりません。
分かる方おねがいします。

411

： １３２人目の素数さん [sage] 2011/09/09(金) 17:40:51.71

質問です。

『ある会社Aが「うちの授業受けた人の90%はTOEFLの点数が20点上がってるよ」って宣伝してました。それに対し、会社Bが「Aは誇張している!」と訴えました。
規制協会が調査に乗り出して、Aの授業を受けた人のうち100人の成績をGET。その内訳は
・50人は35点up
・35人は20点up
・15人は0点up(点数上昇無し)
でした。
この時、有意水準5%でAの主張またはBの主張を検定しなさい。』
という問題なのですが、90%という部分をどう扱えばよいのかわかりません。
その部分さえ無ければ普通の仮説検定でよいと思うのですが…。

412

： １３２人目の素数さん [sage] 2011/09/09(金) 18:59:54.31

>>411

Aの宣伝が正しければ、ランダムに生徒を調べてみたら、100人のうち90人前後が成績upしているはず。
協会が調べてみたら、50人がupしていて、50人は変わらず、だったとしたら、
90%upした集団からのサンプルとは言い難いと考えるでしょうね。

では、85人がupだった場合はどうなのか。90人には足りないけれど、
この85人は、元々のA社の言う90%が正しいとして、「たまたま」5人少なかっただけ、と言えるかどうか。

「普通の仮説検定」の意味がよくわかりませんが、これもごく普通に行われる仮説検定。

413

： １３２人目の素数さん [sage] 2011/09/09(金) 19:27:30.88

>>411

＞点数が20点上がってるよ

２０点「以上」では？

414

： １３２人目の素数さん [sage] 2011/09/10(土) 16:58:00.24

>>411

>90%という部分をどう扱えばよいのかわかりません

期待値の算出に使う

415

： １３２人目の素数さん [sage] 2011/09/10(土) 23:17:01.06

ランダムに選んだ１００人中に成績が上がらなかった人が
１５人以上になる確率を考えればいいんじゃね？

416

： １３２人目の素数さん [] 2011/09/12(月) 13:59:25.12

20%上がっているか、上がっていないかの２値判定なので、２項検定に持ち込む。

20%以上上がっている人が何点であるか、また20％以下の人が何点であるかは関係ない。
「３５点ｕｐ」とか「０点ｕｐ」とかの情報は使われない。引っかけ問題。

417

： １３２人目の素数さん [sage] 2011/09/12(月) 17:45:38.52

>>416

>>413

418

： １３２人目の素数さん [sage] 2011/09/12(月) 18:15:42.92

20点以上上がったか、上がらなかったかという二つのカテゴリーに単純化して二項検定
でいいんじゃないの

419

： １３２人目の素数さん [] 2011/09/20(火) 13:57:36.70

「２つの確率変数XとYの相関係数は０だが、独立ではないような例を示せ」って
たとえば何があるんでしょう？

自分は苦し紛れに需要が完全に硬直的な状態のマネタリーベースと総需要の関係と答えたんですが・・

420

：【34.3m】 [sage] 2011/09/20(火) 14:35:13.45

>>419

相関係数ってのは、二つの変数の間に直線の関係があるかを示している。
なので、右上がり、右下がりといった傾きの無い関係を考えればいい。

経済学部みたいだけど、そういう時の例は経済に限らなくてもいいのでは。

Y=sin(X)、Xの範囲は（－360°、＋360°）とか。こんなに範囲取らなくてもいいけどね。
Y=X^2、Xの範囲は（-1、1）とか。下がって上がるので相関ゼロ。
Y^2+X^2=r^2、XとYの相関はゼロだけど円という関係にある。

421

： １３２人目の素数さん [sage] 2011/09/20(火) 18:40:28.72

>>419

独立性の問題だから理論的な確率分布の話。
例として簡単なのは以下のような離散型確率分布
　 x　y　　確率 p(x, y)
　 0　 1　　 1/4
　 1　 0　　 1/4
　 0　-1　　 1/4
　-1　 0　　 1/4

422

： １３２人目の素数さん [sage] 2011/09/21(水) 04:21:57.55

z = 0　　　… 1/4
z = 1　　　… 1/4
z = 2　　　… 1/4
z = 3　　　… 1/4

x = sin(zπ/2)
y = cos(zπ/2)

423

：忍法帖【Lv=6,xxxP】 [] 2011/09/22(木) 00:04:05.90

控除率５０パーセントの宝くじって、一度に１０００万ぶん買うと平均して５００万もどってくるってこと？

424

： １３２人目の素数さん [sage] 2011/09/22(木) 00:23:03.27

控除率は、そういう使い方をするようだな

425

： １３２人目の素数さん [] 2011/09/22(木) 04:12:30.76

日本の宝くじは控除率５４％じゃなかったっけ？
世界で最も割の悪いギャンブル。
損することが決定しているギャンブル。

426

： １３２人目の素数さん [sage] 2011/09/22(木) 20:49:05.06

>>425

そういう発想で言うなら、得するギャンブルはないと思うけど。
胴元が損するギャンブルつうか。

427

： １３２人目の素数さん [sage] 2011/09/22(木) 20:52:14.95

＞損することが決定しているギャンブル

もし俺がたった一枚買った宝くじが
末等以外のどれかにあたれば
払った金額よりも受け取る金額のほうが高いのだが
それは「損」にあたるのか？

428

： １３２人目の素数さん [sage] 2011/09/22(木) 20:56:51.50

個別の問題を取り上げても仕方ないだろヴぉけ

429

： １３２人目の素数さん [sage] 2011/09/22(木) 20:57:40.02

個別で考えずに、何が「損得」なんだ？

430

： １３２人目の素数さん [] 2011/09/22(木) 21:00:28.12

質問です。
統計学で出てくるt分布の数表って、誰がどうやってつくったんですか？
適当に乱数降ってシミュレーションしたんでしょうか。
あと、p値ってコンピュータで求める方法（アルゴリズム）あるの？
ってか教科書の数表には普通にでてくるんだけど、あれはどうやって算出してるんですか。

全然わからなくて困ってます。教えてください。

431

： １３２人目の素数さん [sage] 2011/09/22(木) 21:20:55.87

どっかで見たような… マルチなのか？

432

： １３２人目の素数さん [sage] 2011/09/22(木) 21:31:30.19

わからなくて困ってるなんて書く人が書く内容じゃないと思うが。
本当にわからないのなら、わからなくても困らない。

433

： １３２人目の素数さん [sage] 2011/09/22(木) 21:40:19.08

なにこの流れ

434

： １３２人目の素数さん [] 2011/09/22(木) 21:46:13.40

分割表の独立性検定の証明がみたいのですが、
どこかにあるかわかりませんか？

435

： １３２人目の素数さん [sage] 2011/09/23(金) 01:45:28.99

分割表の独立性検定の証明ってなんのこと？

436

： １３２人目の素数さん [] 2011/09/23(金) 16:05:29.82

I×J分割表における独立性の帰無仮説の元でピアソンのカイ二乗統計量が
自由度なんぼかのカイ二乗分布に法則収束する証明のことです。

437

：【18.5m】 [sage] 2011/09/23(金) 18:58:07.68

>>425

宝くじってのは、行政（主に地方自治体）が政策をやる時にお金を
集める手段なので、控除率が高いのは当然。

当たったらラッキー。でも元々行政に資金を供給するために宝くじ
買ったんだから残りはちゃんと使ってね。くらいの気持ちで買うもの。

438

： １３２人目の素数さん [sage] 2011/09/23(金) 20:01:13.29

>>436

ttp://www.stats.ox.ac.uk/~steffen/papers/cont.pdf
↑の分割表に関する講義録だと、多項分布の尤度比検定統計量の
漸近的近似として扱ってるね。まあそんな感じで既に証明されてる一般的性質を
使うのが普通。

439

： １３２人目の素数さん [] 2011/09/23(金) 20:48:39.32

モデル言うの忘れてました。すみません。多項分布に関してです。
尤度比統計量は、まだ証明してません。積多項分布の一様性検定は証明できたのですが、
多項分布における独立性検定が難しいんですよね。最終的には、対称性検定を証明してから
漸近展開していきたいので、そのステップにと思ったのですが・・・。

440

： １３２人目の素数さん [] 2011/09/25(日) 00:47:45.95

臨床医やってるものですが、論文書くのに統計家に相談するにはどういう方法がありますか？
金積むってのはなしで。

441

：【13.1m】 [sage] 2011/09/25(日) 02:46:59.71

>>440

自分が卒業した大学の統計講義の担当者に相談する。
自分の所属した研究室の関係者経由で探す。

ただし、相談される相手も、あなたの相手で時間を取られるわけだから、
手土産くらいはあった方がいいと思うよ。

442

： １３２人目の素数さん [sage] 2011/09/25(日) 13:43:34.94

>>72

医学部医学科

443

： １３２人目の素数さん [sage] 2011/09/25(日) 13:56:11.31

薬学農学たくさんもいそう

444

： １３２人目の素数さん [] 2011/09/25(日) 22:54:12.45

>440

統計数理研究所の統計相談に申し込む

445

： １３２人目の素数さん [sage] 2011/09/25(日) 23:03:23.22

>>444

随分遠くになったよな

446

： １３２人目の素数さん [] 2011/09/26(月) 08:42:49.03

　
政府がインチキであれば貿易統計もウソ

外部リンク

ttp://2nd.geocities.jp/jmpx759/0203/35/235_1.html

最近の経済評論家がアホなわけ。

政府の発表する経済情報がウソであり、

（いや、昔からウソの連続なのだが、）

それが一般に感づかれてしまったため、

まともな話が出来なくなった。

これまでも評論家の話はインチキだったが、

表面上、辻褄合わせの話でごまかせていた。

（仮説を含む）

447

： １３２人目の素数さん [] 2011/09/26(月) 08:44:38.29

統計数理研究所て何やってるの？

448

： １３２人目の素数さん [] 2011/09/28(水) 15:34:34.01

「パラメータを推定する」とよくありますが、一体どういうことですか？
簡単言うと何をやってるんでしょうか？そして、なぜ推定できるんですか？
どれだけ説明を読んでも全く理解できません。どなたか教えてくださいませんか？

449

： １３２人目の素数さん [sage] 2011/09/28(水) 15:39:26.18

まあLevenberg-Marquardtだな　よく使うのは

450

： １３２人目の素数さん [sage] 2011/09/28(水) 16:02:37.27

>>448

>どれだけ説明を読んでも全く理解できません。どなたか教えてくださいませんか？
例えば、私がここで説明しても、

>>448

は「説明を読んでも全く理解できません。」と言うのだろうと推定される。

451

： １３２人目の素数さん [] 2011/09/28(水) 17:53:08.09

分からん

452

：【15.9m】 [sage] 2011/09/28(水) 20:15:13.32

>>448

ちょっとだけ説明しよう。
以下のＸは標本平均、σは標本平均の標準偏差（ただし母分散はわかってる）
だとする。

μ-ｍσ＜Ｘ＜μ+ｍσ
から
Ｘ-ｍσ＜μ＜Ｘ+ｍσ
へ、発想を転換する。

後は考えろ。

453

： １３２人目の素数さん [sage] 2011/09/28(水) 20:17:42.34

>>448

んと、例えばテレビの視聴率を知りたいとして、
関東圏 2011/09/28 午後8時の日テレ視聴率を p （0≦p≦1）とする。
この p が知りたい「パラメータ（母数）」。

視聴率調査では、関東の全世帯から６００世帯を無作為に抽出して、
調査機をテレビに設置する。
2011/09/28 午後7時に送られて来たデータの60件が日テレを視聴してれば、
60 / 600 = 10% が知りたいパラメータ p の「推定値」になる。

世帯を無作為に選んでいるので、確率法則によって、この推定値の
誤差を見積もることも可能。（一般に抽出世帯数が多いほど誤差は小さくなる）

454

： 453 訂正 [sage] 2011/09/28(水) 20:20:41.89

×2011/09/28 午後7時　○2011/09/28 午後8時

455

： １３２人目の素数さん [sage] 2011/09/28(水) 21:16:38.36

みなさん本当にありがとう

に関しては「その通り」としか言えません

μとmは例えば何ですか？

標本抽出した後に、さらに標本を抽出しても解けますよ、ということですか？
確率って色んな事象でそれぞれ違うものだと思ってたんですが、
なぜ確率法則で推定できるんですか？
あらかじめ、これはこの分布（正規分布とか？）だ！と決めてしまうということですか？

ごめんなさい、質問ばっかりになってしまいました

456

：【13.3m】 [sage] 2011/09/28(水) 21:31:44.31

>455
その質問をするところを見ると、統計の本を読んでないのがわかる。

説明がわからなくても、μについてなんですかと質問することは、
統計の本を読んでいればあり得ない。

とりあえず、「どれだけ説明を読んでも全く理解できません」てのは
何に書いてある説明を読んだのか教えて。

457

： １３２人目の素数さん [sage] 2011/09/28(水) 21:36:19.66

>>453

統計学のど素人なのですが、教えてください。

> 一般に抽出世帯数が多いほど誤差は小さくなる

あくまでも、①各世帯のデータが独立であること（ある世帯の視聴結果が他の世帯の視聴結果に一切影響しないこと）、
②無作為抽出であること、の２つ両方の条件が満たされることが大前提ですよね？

458

： １３２人目の素数さん [sage] 2011/09/28(水) 21:50:58.65

>>456

今は家に帰って来てしまったので本の名前は分かりません
μは平均だと思ってたんですが、違うようです

信じられないんだと思いますが、本は何冊も読んでます
でもその本を理解できないんです
そのレベルの頭なんです
正直、

>>452

の文字の意味が分かったとしても、多分何を言いたいのかは分からないと思います

459

： １３２人目の素数さん [sage] 2011/09/28(水) 23:50:10.38

>>457

＞②無作為抽出であること、

それは大前提。

＞①各世帯のデータが独立であること（ある世帯の視聴結果が他の世帯の視聴結果に一切影響しないこと）、

こちらは無関係。また母集団においては「独立」という概念もないです。
というか、社会的な特性なら、口コミや世代・職業・性別・地域文化など、
母集団のメンバー間に何らかの影響関係が存在するのが普通です。
また身長などの身体特性にも、年齢・性別・国・民族などの共通関係があります。
したがって平均特性の異なる母集団層を、標本抽出時に区別することが
できる場合には、同じ無作為抽出でも、より高度で精度の高い比例抽出法や
層別抽出法などが使われます。（詳細は「標本調査法」を参照）
実験計画法や臨床テストのコントロールグループ構成なども同様

460

： １３２人目の素数さん [sage] 2011/09/29(木) 00:07:59.42

>>455

＞なぜ確率法則で推定できるんですか？

下手な鉄砲でも数撃てば当たるから。

461

： １３２人目の素数さん [sage] 2011/09/29(木) 00:47:01.36

神がいるから。

462

： １３２人目の素数さん [sage] 2011/09/29(木) 01:29:22.46

>>459

丁寧に説明いただき、ありがとうございます。標本調査法について詳しく調べてみます。

ただ、無作為抽出によるパラメータ推定は、母集団の分布が分かっている場合に限る、
ということになると思うのですが、その認識は違いますでしょうか？

また、往々にしてビジネスでは、母集団そのものの分布が分からない、推定したい
（パラメータの平均・標準偏差、そもそも正規分布していると仮定してよいかどうかさえ分からない）、
ということがよくある（というか、ほとんど）と思います。

その場合、限られた標本（例：キャンペーン時のアンケート調査結果や一部の消費者の購買履歴）から
母集団に関する意味合いを導き出そうとした場合、統計学的にはどのようなアプローチが考えられるのでしょうか？

たくさん質問してすいません。私なりに統計学の入門書等を読みはじめ、ビジネスでの使い方等を
検討しているのですが、理解がなかなか進まないこともあり、いまひとつ、道筋が見えてこないのです・・・。

463

： １３２人目の素数さん [sage] 2011/09/29(木) 02:35:22.23

母集団の分布が分からなくても、何回も抽出した標本の平均の分布は正規分布なんだな。
言ってる意味が分からないと思うが。

464

： １３２人目の素数さん [sage] 2011/09/29(木) 19:53:15.22

>>463

で、何回も抽出した標本の平均の分布が正規分布に従うから、何なの？

465

： １３２人目の素数さん [sage] 2011/09/29(木) 21:24:50.25

>>462

＞無作為抽出によるパラメータ推定は、母集団の分布が分かっている場合に限る、
＞ということになると思うのですが、その認識は違いますでしょうか？

違います。

例えば視聴率調査の場合だと、母集団分布は「観た割合 p」「観なかった割合 1-p」。
それは「分かって」いますし、その知識を前提にすることは何ら制約にはなりません。
そして未知な部分である p の値を、「無作為抽出した標本中の観た割合＝標本割合」
によって推定するわけです。

しかし身長などの数値型特性の場合には、結果の種類が多すぎるので
上のように各値の母集団割合を正確に推定するには大標本が必要になります。
しかし普通はそこまで全てを知る必要もないわけです。
そこで母集団の平均値 μ だけを考えて、どんな分布形なのかは未知とします。
それでも標本平均値から μ は簡単に推定可能です。

（続く）

466

： 465続 [sage] 2011/09/29(木) 21:27:14.00

>>462

＞また、往々にしてビジネスでは、母集団そのものの分布が分からない、推定したい
＞（パラメータの平均・標準偏差、そもそも正規分布していると仮定してよいかどうかさえ分からない）、
＞ということがよくある（というか、ほとんど）と思います。

ビジネスに限らず、先の二項母集団のように単純な場合を除けば、
母集団分布形は未知であることが普通ですよ。
しかし多くの場合、推定精度の評価や検定などの統計処理には、よく「正規分布」が
使われます。それが誤解の元かと。しかしこれは「母集団分布に関する仮定」
なのではなく、単なる「簡便計算法」にすぎません。

つまり、（上に話が出ているように）標本のサイズが少し大きくなると、代表的な
推定値の確率分布は極めて正規分布に近くなります。そこで、より扱いやすい
正規分布を使って「確率の値を近似」する、という実際的なアプローチです。
Excelなどで正確な分布から求めた確率値と、正規分布を使った結果とを
比較してみれば、差は無視できるぐらい小さいことが確認できます。

このあたりの内容は注意事項とか枝道も多いので、サクッとしたレベルでの話ですが、、、

467

： １３２人目の素数さん [sage] 2011/09/29(木) 22:57:55.58

ベンフォード分析の適用についてご教授下さい

「自然界の数値群」という適用条件の定義が分かりません
例えばフィボナッチ数列
Ａ(n)＝Ａ(n-1)＋Ａ(n-2)
に適用できて、等比数列
Ａ(n)＝Ａ(n-1)×10~(n-1)
には適用できません。
適用条件の定義について教えてください

468

： １３２人目の素数さん [sage] 2011/09/29(木) 23:20:13.66

>>464

母集団の分布が分からなくても、推定するときにとても役に立つわけです。

469

： １３２人目の素数さん [sage] 2011/09/29(木) 23:43:28.92

通常の調査で実際に母集団の分布が未知であるとはいっても、普通は、標本をみるとこれは正規分布と考えられますね、という検定はできるよね？
それに、母集団がそもそも正規分布じゃない場合はどうするの？

>>466

の説明だけ聞くと、何にも分からないし正規分布と程遠いかもしれないけどとりあえず正規分布になるってことにしちゃえよ、
それで分析しちゃえよ、だって分析が楽じゃん、で、なんとなく数字を出してみました、それが「推定」ですと言っているようにしか見えない

例えて言うなら、
コイツ何言ってるのか分かんねぇよ、多分文句言ってるんだよ、文句言ってるんだと思って対応しとけばいいよ、それが正義だから、
と言ってるのと同じことやってるように思える

470

： １３２人目の素数さん [sage] 2011/09/30(金) 02:00:09.88

>>465

,466
457,462です。ご説明ありがとうございます。
私の勉強不足のため、いただいた内容をきちんと理解できてはないと思いますが、
少し、頭が整理できてきたような気がします。

>しかし多くの場合、推定精度の評価や検定などの統計処理には、よく「正規分布」が
>使われます。それが誤解の元かと。しかしこれは「母集団分布に関する仮定」
>なのではなく、単なる「簡便計算法」にすぎません。

「簡便計算」により、実用的に十分な精度で推定値を求める、もしくは、値の範囲を絞ることができる、ということですね。
そして、その簡便計算のもとになる確率分布がいろいろ存在すると（正規分布、t分布・・・）。

ただ、統計学の素養がない人（私もですが）に対して、簡便計算を適用することそのもののの妥当性や
仮定する確率分布の妥当性を理解してもらうのは、現実的にはかなり厳しいですよね？

つまり、統計学の素養がない人に対して、「未知の母集団（例：ある商品の消費者の1ヶ月あたりの購入金額の
平均）に関して、こんなことが分かりましたよ（推定されましたよ）」と言ったときに、いかに推定値の信頼度が
（統計学的に）高いかを説明しても、納得感を十分にはもってもらえなさそうですね・・・。

いずれにしても、自分でサンプルデータを使って手を動かして実際に数値を出してみながら、
テキストの理解を進めていき、何がどう使えるのかを自分で探っていきます。

早く、このスレの皆さんの話についていけるようになろうと思います。

どうもありがとうございました。

471

： １３２人目の素数さん [sage] 2011/10/01(土) 01:46:17.62

SPSS ってIBMが出してるマニュアルないんですか？

472

： １３２人目の素数さん [] 2011/10/03(月) 12:27:21.20

重回帰分析について。

【質問１】
AICなどの説明変数選択規準を用いたとき、分散分析のｐ値では
有意であると判断できながら、説明変数のｐ値を見ると、有意ではない説明変数が
含まれることがあります（例：有意水準５％）。

説明変数のｐ値が有意かどうかで判断できるのならば、AICなどの方法で
変数選択を行う意義はどこにあるのでしょうか。

また説明変数選択規準を考慮するのならば、説明変数の有意性は
どのように解釈すれば良いのでしょうか？

【質問２】
変数選択を行うと、多重共線性を取り除くこともできることがある、
というのは正しい理解でしょうか。

473

： １３２人目の素数さん [] 2011/10/03(月) 12:31:46.88

>>472

472です。

この質問の回答に相当する内容が載っている書籍をご紹介いただくのも歓迎です。

地元の図書館や国会図書館に置いてあるといいな。

474

： １３２人目の素数さん [] 2011/10/03(月) 14:26:49.43

>472

ｐ値で変数選択はできません。
　「有意でない」と「ない方がよい」は違います。

　ｐ値で変数選択している場合は多重共線性は考慮されません。
　ｐ値の信頼性が低下するだけです。

475

： １３２人目の素数さん [] 2011/10/03(月) 15:25:34.53

>474

返信ありがとうございます。
つまり、「有意でないからと言って、その変数は採用しない方が良いとは言えない」ということですね。

確かに説明変数間に多重共線性が起こっている場合、採用する説明変数によって回帰係数が不安定になるので、おっしゃるようにｐ値の信頼性が低下するということですね。

476

： １３２人目の素数さん [sage] 2011/10/03(月) 23:00:14.65

>>472

２の方ですが、実感では取り除けることもあります。
ただもちろん取り除けないこともあるので多重共線性を取り除く方法として
使えるわけではありません。
このあたりを明確に書いた書籍は知りません。

477

： １３２人目の素数さん [] 2011/10/03(月) 23:05:22.86

>>476

ご回答ありがとうございます。
そうですね。
わたくしの理解では「取り除くこと『も』」できるという程度で、
多重共線性が起こっていることを見つける方法は
いくつか提唱されていますね。

478

：【20.8m】 [sage] 2011/10/04(火) 00:23:35.90

>>472

そもそも重回帰分析を行うということは、複数の変数のセットで
説明ができるかを考えているので、その場合は個々の変数の有意性
には意味がない。

変数の組み合わせにおり、ここの変数が有意かどうかは変化してしまう。

重回帰では、ある変数を追加したり、減らしたりすることで、変数の
セットとしての説明力がどうなるのかが重要で。
変数を単に増やせばそれは見せかけ上の説明力が高くなってしまう。
そこで、変数のセットの説明力を比較する指標が必要になる。

とはいえ、被説明変数に対する影響が統計的に誤差の範囲と扱われて
しまうような説明変数の集まりでは説明に困るので、主たる説明変数は
それなりに有意な方が話がしやすいね。

479

： １３２人目の素数さん [] 2011/10/05(水) 12:06:35.51

>>478

これまでにいただいた回答も含めて考えてみると、
どうもまだ体系的に理解できていなかったことに気づきました。

疑問だった点がスッキリしました。
本当に感謝します。ありがとうございました。

480

： １３２人目の素数さん [sage] 2011/10/05(水) 16:03:43.77

このスレはテーマが実務に近いから基地外が集まらないな。

481

： １３２人目の素数さん [sage] 2011/10/05(水) 18:28:09.46

キチガイコレクターに用はありません。お帰りください。

482

： １３２人目の素数さん [] 2011/10/12(水) 13:41:27.70

FAQっぽくて恐縮ですが、
対応のない２種のt検定（分散が違うのでWelchの方法）で、「平均に差がない」帰無仮説ではなく、
「平均の差が○○以下」という帰無仮説を棄却したい（＝p<0.05で平均が○○以上差があることを示したい）のですが、
どうすればいいのでしょうか？

Excelでできるみたいなのですが、そうではなく、アルゴリズムも知りたいです（自分で実装するため）。

483

： １３２人目の素数さん [] 2011/10/13(木) 12:12:18.29

時系列順に65234,65219,65109,68749,63411というデータがあります。
5つめがこれまでの4つに比べて減ったかどうかを仮説検定するには、どう計算すればよいでしょうか。
おそらく母集団が何にしたがっているのかもわからない状態です。(こういうときにとりあえず正規分布を仮定してもいいのでしょうか)
ウェブ上のこのページの通りにやればできるよというようなお答えでも結構です。どうかヒントだけでもお教え下さい。

484

： １３２人目の素数さん [] 2011/10/13(木) 19:47:50.32

このスレ、むずい質問多いッスね。

485

： １３２人目の素数さん [] 2011/10/13(木) 20:53:03.22

＞４８２

一方の全てのデータから○○を引いて、
「平均に差がない」のt検定（片側）をしなさい。

486

： １３２人目の素数さん [sage] 2011/10/13(木) 22:21:11.53

>>483

超能力者にしか無理です。

487

： １３２人目の素数さん [sage] 2011/10/13(木) 22:31:23.09

>>486

それはデータの数が少ないからですか?

488

：学生 [] 2011/10/13(木) 22:40:55.06

統計学と製薬会社に関係があると聞いたのですが、
具体的にどのようなところで使われているんですか？
あと、品質管理と統計学にも関係があると聞いたのですが、
どこで使われていますか？

489

： １３２人目の素数さん [sage] 2011/10/13(木) 23:23:55.17

ある製薬会社である病気に効果が期待できる投薬を開発した。
その病気をもつ患者３００人を１００人ずつの３つグループＡ、Ｂ、Ｃに分け、
Ａグループには新薬の実験に参加協力の了解を得た上で新薬を投薬
Ｂグループには新薬の実験に参加協力の了解を得た上でブドウ糖を投薬
Ｃグループには何もしない
という状況で経過を見た。結果、Ａグループは５５人が回復、Ｂグループは５０人が回復、
Ｃグループは４５人が回復した。さて、この新薬は効果があったのだろうか？
このような事をきちんと判断できる数学的能力が不可欠。

490

：【17.7m】 [sage] 2011/10/14(金) 01:18:05.89

>>488

品質管理を書いておくと
例えば、原材料を購入したとしてそれが必要な品質を満たしているかは
確認しないといけない。
その際、全て調べるわけにはいかないので、抜き取りで検査をする。
どれくらい調べればいいかを決めないといけないので統計学を使う。

後は、製品（薬）を作る時に、機械で自動で作っているとする。
でも、作っているうちに、機械がずれてきて、製品の精度（薬の
内容物の量）などがおかしくなってくる。
そこでできた薬を定期的に調べて、機械の調子を調べるんだけど、
機械をきちんと調整してあっても少しはずれるので、どれくらい
ずれたら機械がずれたと判断して再調整するかを考えないといけない。
こういうのでも統計学を使う。

491

： １３２人目の素数さん [sage] 2011/10/14(金) 03:39:02.20

>>482

Welchの t値の式の分子を

A = ｜（ｘの標本平均-μx） - （yの標本平均-μy）｜＝｜ｘの標本平均-yの標本平均-(μx-μy)｜

として、仮説：｜μx-μy｜＜ε の範囲で最小になる A を使えば良いんでない？
分母や自由度は同じ。つまり一番判別しにくい仮説値で検定。
しかし信用されるには、どっかの本か論文に出てる必要があるね。

>>483

それだけしかデータが無い場合、統計学的には何も言えないと思うよ。

492

： １３２人目の素数さん [sage] 2011/10/14(金) 09:19:38.65

>>487

どんな分布かわからないから
だろうね。

493

： １３２人目の素数さん [] 2011/10/14(金) 10:33:37.84

>491

なんでやねん。

データから定数を引いても、分散構造は全て維持されるので、
４８５の方法で十分。

494

： 482 [] 2011/10/14(金) 15:41:09.10

引き算する値（kとします。）を変えていくとpの値
（今はとりあえずExcelのttestを使っています。ttest(***,***,1,3)という形式で）が
変わっていきますよね。
そのときに最大のpを与えるkが２群の最も確からしい平均値の差と言って良いのでしょうか？

495

： １３２人目の素数さん [] 2011/10/14(金) 15:47:51.15

>494

推定したいのか、検定したいのか、どっちやねん。

ｋが決まっているならｔ検定
ｋを求めたいなら推定。（不偏推定量は単に平均値の差だ）

496

： 482 [] 2011/10/14(金) 16:37:33.88

もっとも確からしいk（平均値の差）を求めたいんです。検定と推定で混乱しています...。
まだ、何が分からないのか分からない段階です。

497

： １３２人目の素数さん [] 2011/10/14(金) 17:02:12.59

kは点推定でいいのか、区間推計したいのか、どっち？

498

： １３２人目の素数さん [] 2011/10/15(土) 01:19:33.35

区間推計の幅の中央が点推定と一致するのでしょうか？　だったらとりあえず区間推計します。
点推定だけでも良いです。

499

： １３２人目の素数さん [sage] 2011/10/15(土) 19:14:29.00

一致するよ。点推定値±ｔ値×標準偏差　の形になるから。
また自由度が２５以上ならｔ値は正規分布値とほぼ同じだから、
正規分布値を使えばデータ自体は正規分布に従う必要がない（大標本法）。

500

： 499 [sage] 2011/10/15(土) 19:23:12.12

この場合は、正規分布値→標準正規分布の臨界値、ね。
あと細かくは、ｔ値→t分布の臨界値、標準偏差→推定量の標準偏差（標準誤差とも言う）。

501

： １３２人目の素数さん [] 2011/10/17(月) 16:12:26.55

会社の中で、売り上げなどをSPSSを使って実際に分析し経営などを考えてる人はいるんですか？
というのも、大学で今は心理学の統計分析のためにSPSSを習っていますが、普通の企業に就職した場合
このSPSSを使えるという能力は役に立つような場面はあるのかと思いました。

502

： １３２人目の素数さん [sage] 2011/10/17(月) 16:55:29.72

>>501

統計よりも財務諸表を読めるのが大事。

503

： １３２人目の素数さん [] 2011/10/17(月) 19:36:29.65

>501

いない。
世間知らずもいいところ。

504

： １３２人目の素数さん [] 2011/10/17(月) 20:32:50.43

>>501

すでに

>>503

が回答しているが、全くそのとおり。

世間では、まず統計学というものを知らない。
知らないから何に役に立つのかもわからない。
占いと同程度だと思われている。

505

： 猫は夜行性 ◆MuKUnGPXAY [age] 2011/10/17(月) 21:30:55.23

Statistical Package for the Social Sciences

猫

506

： １３２人目の素数さん [sage] 2011/10/17(月) 22:46:06.37

>>501

503,504が回答しているが俺も一言。

仮に、価値のある意味合いを導き出せ、（SPSSでも何でもよいが）統計的に分析してこんなことが分かりました、
だから、こうしたほうがよいですってアクションにつながることを言えたとしても、
説明する相手（例えば、経営層や上級管理職）が統計学の素養を持っていなければ、納得してもらえない。
そして、そのような素養を持っている人は極めて少ない。

主張に対する根拠を補強する、箔をつける、という補助的な意味合いで、統計分析の結果をビジネスに
利用することはあるかもしれないが、主役にはなり得ない。

507

： １３２人目の素数さん [sage] 2011/10/17(月) 22:52:23.51

知らない人から見れば、統計学はうさんくさく、占いよりも役に立たない。

508

： １３２人目の素数さん [sage] 2011/10/18(火) 00:11:43.68

まぁ学生は世間知らずでいいんだけどね。
大人気ない社会人が多いなｗｗｗ

>>501

社会に出てすらこの程度だ気にすんな。
ただ言ってることは正しいけどな。

509

： １３２人目の素数さん [sage] 2011/10/18(火) 01:23:57.32

社会なんかに出なくても、文系学部の大半はそんなもんだよ、学生も、先生も。

510

： １３２人目の素数さん [] 2011/10/18(火) 02:23:25.10

文系、理系、違いは感じないけどな。
個人の能力差のほうがよほど大きい。

511

： １３２人目の素数さん [] 2011/10/18(火) 03:53:43.59

猫は？

512

： 猫はイケメン ◆MuKUnGPXAY [age] 2011/10/18(火) 07:03:58.21

何か用事ですかね？

猫

513

： １３２人目の素数さん [] 2011/10/18(火) 08:02:59.39

>>512

起きとるか？
サンマが旨い季節だな。

514

： １３２人目の素数さん [] 2011/10/18(火) 08:06:24.58

>>512

欧州大手の銀行破綻だが、
これでEUはギリシャを見捨てるだろうか？
何れにしても今まで経験した事がない規模での
世界大恐慌のフラグが立ったな。
日本はどうなることやら。。。

515

： 猫はイケメン ◆MuKUnGPXAY [ｇいりしゃage] 2011/10/18(火) 09:41:50.10

>>514

ギリシャからアイルランド、スペイン、ポルトガル、イタリアと来た経
済危機ですが、ギリシャがデフォルトになったら（EUとして）困るのは
当たり前ですからね。だから酷い事になる前にDEXIAを管理破綻させたと
いう考え方ではないですかね。でもコレで済むかどうかは判りませんね。
どうもこのままではギリシャ自身を管理破綻させた上で、他にも関連の
国債（特にギリシャのヤツとイタリアのヤツ）を保有している銀行を守
るという考え方なんですかね。

極めて危険な状態に突入しつつある感じですね。ちゃんとフランスが持
ちこたえてくれるかどうか心配です。

猫

516

： １３２人目の素数さん [sage] 2011/10/18(火) 10:26:10.59

>>510

理系で、統計がわからないかつその結果を信じないてのが、そんなに(文系ほどに)いる？

517

： １３２人目の素数さん [] 2011/10/18(火) 10:29:50.48

＞５０１　の世間知らずなところは、「経営に役立てる」という部分。
経営ってそういうものじゃない。生き残るのに精一杯。

かといって統計が社会で使われていない、ということではない。
専門的、研究的な部分では重要。

例えば、製薬での疫学、小売りのマーケティング、金融のリスク管理、コンサルタントの調査など。
統計で食っていくためには、「統計＋専門分野」が必須である。
統計だけの職業はあり得ない。

518

： １３２人目の素数さん [sage] 2011/10/18(火) 11:30:08.84

>>517

＞経営ってそういうものじゃない。生き残るのに精一杯。

役立てるのと生き残るのは反しないと思うが

519

： １３２人目の素数さん [sage] 2011/10/18(火) 11:35:06.21

誰かを論破してやりたい気持ちが逸っちゃったんでそ
親切にも統計が役立つ例を挙げてくれてるけど

520

： １３２人目の素数さん [] 2011/10/18(火) 13:23:51.39

＞役立てるのと生き残るのは反しないと思うが

反するよ。社会に出ればよくわかる。

在庫管理みたいないかにも統計的な問題でも、
当用仕入れで処理している会社がが９９．９％だ。

馬鹿だからそうしているのではなく、現場の猥雑さを体験すれば、
誰でもそうなる。

521

： １３２人目の素数さん [sage] 2011/10/18(火) 14:10:53.07

「統計を役立ている会社は生き残れない」

この命題が真のときに「反する」と言うんだと思うんだが
現場では違うのか？

522

： １３２人目の素数さん [sage] 2011/10/18(火) 14:18:17.82

>>521

520が言いたいのはそういうことではなく
現場では少数の例外は無視していいということになっている
ということだろ。

523

： １３２人目の素数さん [sage] 2011/10/18(火) 14:22:15.58

ほとんどすべての実数はx^2=4の解ではないので解なしってことで良いですか？

524

： １３２人目の素数さん [sage] 2011/10/18(火) 14:23:41.68

在庫管理て、統計的な問題なの？
生産計画でなくて？

525

： １３２人目の素数さん [sage] 2011/10/18(火) 14:27:49.37

季節要因とか過去データに基づいて在庫調整するってのはあるよね

526

： １３２人目の素数さん [sage] 2011/10/18(火) 14:28:40.71

A：統計を会社経営に役立てる
B：会社が生き残る

>>520

の話は
「AとBは背反」ではなくて「AはBの必要条件でない」だ。
統計の前に数学適論理の基本をやり直したほうがイイ。

527

： １３２人目の素数さん [sage] 2011/10/18(火) 14:32:06.84

>>525

その在庫調整って、仕入れや販売や生産の計画でするんでないの？

528

： １３２人目の素数さん [sage] 2011/10/18(火) 14:36:00.88

それが在庫管理なのか生産仕入計画なのかは言葉の問題だが、
いかにもというほど統計的なものではないな。

529

： １３２人目の素数さん [sage] 2011/10/18(火) 16:02:05.48

論理もそうだが、『社会に出たら』とか書いてるあたりでただのしったかとしか思えん。個人的にはだけど。

530

： １３２人目の素数さん [sage] 2011/10/18(火) 23:02:55.96

説明できないバカに限って社会に出たら分かるとか言っちゃう法則

531

： １３２人目の素数さん [sage] 2011/10/18(火) 23:28:55.82

べつに限ったわけじゃないのに
限ってを慣用句として使っちゃう法則

532

： １３２人目の素数さん [sage] 2011/10/18(火) 23:34:08.40

かと言って「社会に出たら」とか言い出しちゃうやつが馬鹿であることには疑いを挟む気にならない。

533

： １３２人目の素数さん [sage] 2011/10/18(火) 23:38:26.75

じゃぁ会社に入ったらていう

534

： １３２人目の素数さん [sage] 2011/10/18(火) 23:43:39.99

そもそも質問者の501はまだ大学生でしょ？
学生相手に世間知らず（ｷﾘｯ　とか痛すぎる

535

： １３２人目の素数さん [sage] 2011/10/19(水) 00:12:34.18

>>532

おれは「社会に出たら」とセットで述べられるものを聞いてからでないと判断できないと思うよ。

536

： １３２人目の素数さん [sage] 2011/10/19(水) 00:25:28.15

>>535

まぁそうだけどね。
件の内容はそうではないと考えるからだけどね。
社会人10年以上やっててそんなこと言うのは社会人なりたてか、使えないやつくらいだし。

537

： １３２人目の素数さん [sage] 2011/10/19(水) 00:43:27.05

>>523

他の書き込み読まないで考えた
その方程式は解が厳密に決まりすぎておかしい
どこかに落とし穴があるに違いないから解なしってことで良いです

538

： １３２人目の素数さん [sage] 2011/10/19(水) 05:17:23.19

>>537

x-5>0 これも大半の実数は解にならないので、解なし？

539

： １３２人目の素数さん [sage] 2011/10/19(水) 08:35:28.23

>>538

それは「大半の実数は解にならない」といえるのか？

540

： １３２人目の素数さん [sage] 2011/10/19(水) 11:11:25.77

負の実数 → ×
０ → ×
５以下の正の実数 → ×
５を超える正の実数 → ○

負の実数だけで実数のほぼ半分なので
実数の半分以上は×と言うのは乱暴だろうか？

541

： １３２人目の素数さん [] 2011/10/19(水) 11:32:17.74

>>501

ツールはSPSSでも何でもいいけども、経験や勘「だけ」を頼りに意思決定をするのに比べれば、
「もしこれまでのデータから何か規則性や法則性があるのならば」
その傾向を統計解析などを利用して把握するということに意義はあります。

絶対にないとは言い切れませんし、役に立たないとも言い切れません。
また役に立つ「場合もある」とは言えるのです。
マーケティングや工業分野などではSPSSやS-PLUSなどの統計解析ソフトのほか、
データマイニングソフト（Visual Mining StudioとかSPSS Modeler）を
日常の実務で利用している会社はあります。

また書店ではビジネスパーソンを対象にした
データ分析・統計解析関連の本も発売されています。

542

： １３２人目の素数さん [] 2011/10/19(水) 16:44:06.75

すみません。リンク先の
↓
【もう限界】九州電力・玄海原子力発電所 13
ttp://kamome.2ch.net/test/read.cgi/atom/1318327670/

レス番■344から先、この統計の解析に対して意見がありました。

佐賀県と唐津保健所管内と玄海町の白血病による死亡の状況（人口10万人あたりの白血病による死者数）
▼厚生労働省人口動態統計より
外部リンク

ttp://www.windfarm.co.jp/blog/blog_kaze/post-4139
（レス番■344から先のレスをお読み下さい。）

この解析についてご意見をお願い致します。

543

： １３２人目の素数さん [] 2011/10/19(水) 19:40:22.80

>>542

向こうのスレを読んだ感じ気をつけないといけないのは、

>>356

が書いてる玄海の人口の問題。

確率が低かったとしても、全く癌になる人が出ないってのはまれ。

全国平均が0.005%だとして、玄海の人口が6400人だとすると、玄海で10万人中35人にあたる２人が癌になる確認を求めると

6400!/(2!(6400-2)!)*0.00005^2*(1-0.00005)^(6400-2)=0.0371

つまり3.7％。

なので、５％水準だと有意に違うけど、１％水準だと違うとは言えない。

これはちょうど２人の確率なので、２人以上だと4.1%になる。

まあ、調査をしてみてもいいかもしれないって感じかな。

544

： １３２人目の素数さん [] 2011/10/19(水) 19:43:23.56

１２月１４日は防災に注意だ！

545

： １３２人目の素数さん [sage] 2011/10/19(水) 23:34:34.36

x-5>0はむしろ解あり。
x=4.9999ぐらいでも解。

546

： １３２人目の素数さん [sage] 2011/10/20(木) 00:31:37.66

>>545

過半数が解ではないなら多数決で解なしでいいじゃないか

547

： １３２人目の素数さん [sage] 2011/10/20(木) 00:36:00.35

統計学のスレなんだから
多数決っていうより誤差を味わいたいんだよ。
政治系の板だったら過半数ゴリ押しはとっても楽しいと思う。

548

： １３２人目の素数さん [sage] 2011/10/20(木) 04:07:48.93

利根川進　　MIT教授、RIKEN-MIT神経科学研究センタ所長、ハワードヒューズ医学研究所研究員、
（ノーベル生理学医学賞を受賞）

「うん、それは一つのきっかけがあってね。
　あの[京都大学の経済]研究所に浅田彰という男がいた。
　これがものすごく頭のいい男でね。ぼくがこれまで出会った人間のうちで一番頭がいい男でね。とにかく何でも知っている。
　数学がものすごくできて、文学にも明るかった。基礎教養だけじゃなくて、およそ何でも知っている。
　政治学・社会学・歴史学・文化人類学・金融工学・精神分析・記号論・哲学・美学・音楽・絵画・舞踊・オペラ・
　心理学・建築・現代数学（純粋数学）・理論物理学・コンピューター・医学・薬理学まで知っていた。
　もともと佐和隆光の弟子なんだけど、特別研究員を７年間もやって、そのころから天下に鬼才として名の知れわたっていたというような人なの。
　本人も、体育科（運動神経）のこと以外なら何でもアドバイスしてやれるから何でもきいてくれというくらい幅が広かった。
　だからもちろん、経済学もよく知っていた。あの[経済]研究所で彼が経済学がわかる人だったもんで、ぼくとすごくいい友達になったんです」　

549

： １３２人目の素数さん [] 2011/10/20(木) 15:43:49.13

>>543

さん。玄海原発スレに出向いて説明して頂き、ありがとうございました。

550

： １３２人目の素数さん [sage] 2011/10/20(木) 19:11:38.85

日本は危険な国だから二度と来ちゃいけないと「英語」で世界中に伝えるべき

551

： １３２人目の素数さん [] 2011/10/27(木) 00:40:04.33

・ある母集団から無作為抽出された標本サイズ400の標本があり、その標本平均が1。母分散が100.このときの母平均が2である確率はいくらか？

・ある母集団から無作為抽出された標本サイズ25の標本があり、この標本の不偏標本分散が15である時、母分散が10以下である確率は5％よりも高いか低いか？

教えてー

552

： １３２人目の素数さん [] 2011/10/27(木) 00:41:20.79

原発はもうやめて欲しい。
住めない土地が拡散。。。

553

： １３２人目の素数さん [] 2011/10/27(木) 04:31:35.41

原発は安全です！

決して事故は発生しません！

と言い続けてきた人々はどこにいったの？
責任とらないの？

554

： 猫は認識障害 ◆MuKUnGPXAY [age] 2011/10/27(木) 04:36:11.00

>>553

但し『そういう人を叩く事しか認めない』という考え方も危険。

猫

555

： １３２人目の素数さん [] 2011/10/27(木) 04:38:24.04

まあ、御用学者のせいで
国民が科学を信用しなくなったのは事実。
全て人間が悪いんだけどね。

556

： １３２人目の素数さん [] 2011/10/27(木) 04:50:37.04

中野剛志先生がＴＰＰ賛成論者の詭弁を全滅させたようです
外部リンク

ttp://www.youtube.com/watch?v=9amjatPD_l4
外部リンク

ttp://www.youtube.com/watch?v=8G29qFqId2w

中野先生が敗北宣言、暗殺される？
日本が米国の植民地に。すでに９９％手遅れか？
外部リンク

ttp://www.nicovideo.jp/watch/sm15973549

テレビ・新聞にだまされるな。
気づいたら、
「ｍｙ日本」で検索

557

： １３２人目の素数さん [sage] 2011/10/27(木) 06:21:24.00

>>555

科学より、御用学者のほうが信用できる
と判断しているのだから、国民の責任。

558

： １３２人目の素数さん [sage] 2011/10/27(木) 07:44:41.44

>>557

現段階の科学は、まだ自然界のものではなくて、人間の脳内のものでしかないから、仕方がないorz

559

： １３２人目の素数さん [sage] 2011/10/27(木) 08:36:00.81

>>557

>科学より

その場合の科学（特に議論のあるもの）っていうのが人間からから独立
してアクセスできるものならそう言えるけど、実際は誰かの口や論文を
通してしか接することが出来ないじゃないですか。

560

： １３２人目の素数さん [sage] 2011/10/27(木) 10:00:03.25

おかしいなー。
変な人たちがわざわざきてる。w

561

： １３２人目の素数さん [sage] 2011/10/27(木) 11:35:23.62

>>558

現段階の科学は、まだ自然界のものではなくて、人間の脳内のものでしかない
↓（ならば）↓
科学より、御用学者のほうが信用できる

という主張なのか？

562

： １３２人目の素数さん [sage] 2011/10/27(木) 11:41:54.66

>>559

たくさんの人の言う、科学として正しいと信じられているもの
よりも御用学者個人のほう正しいと信じるのは
その話とは関係ないでしょう。

たとえば、学者が自分の立場や利益のために嘘をつく確率を考えても
立場の違う学者何人もの意見の総合（たとえば共通部分）と、
御用学者１人の意見とではどちらが信用に値するかくらいは
統計的にも言えるでしょう。

563

： １３２人目の素数さん [sage] 2011/10/27(木) 13:05:08.74

原子力関連学者は、日本の原発はほぼ安全だと言ってたし、
他の学者も、安全なんじゃないって言ってた。
そもそも現代社会で、御用か非御用の区別って、簡単にできるのかなー
それに、完全な非御用学者なんて、どれ位いるのだろー
完全な非御用学者がいても、外に発信される時は湾曲されてそうだし。
むずかしいなー

あと、本当に自然界に法則なんてあるのかなー
絶対に例外のない法則って、一つ位発見されたの？

俺、学問好き。科学も嫌いじゃない。
でも、勘違いしてる学者や学者崩れ多すぎて、不快感を感じるのも事実。

564

： １３２人目の素数さん [sage] 2011/10/27(木) 13:08:50.42

後半関係ないし、
多数の意見の共通部分を取り入れることの意義がわかっていないとしか思えない

565

： １３２人目の素数さん [sage] 2011/10/27(木) 14:01:38.59

少なくとも
生活空間にある放射能をもつ物質が健康に与える被害に関する
なにか新しい発見があったわけでもないのに
これまでは危険なので専門家が管理せねばならないと法律でされていたものを
特に対策もせずにほおっておいても安全だと言い出すような学者は
信用出来ないでしょうね。

566

： １３２人目の素数さん [sage] 2011/10/27(木) 18:33:36.11

>>564

すいません。
僕、趣味としてしか(独学で始めたばかりで)、難しいことは分からないんですけど、
多数の意見の共通部分を取り入れる、
とはどうゆう意味で、
その意義についても、教えてくれませんか？
素直に教えて欲しいだけで、悪意や多意はありません。

567

： １３２人目の素数さん [sage] 2011/10/28(金) 16:11:10.07

趣味として学問始めたばかりなのに、勘違いした学者とかどんだけ傲慢なんだ。
結果としてその学者が誤っているとしても趣味程度に始めた学問で専門家と呼ばれる人間を勘違いとかいうのは、
それこそ当人の勘違いも甚だしい。

568

： １３２人目の素数さん [sage] 2011/10/28(金) 18:13:45.20

でたｗ
勘違いｗｗ

569

： １３２人目の素数さん [sage] 2011/10/28(金) 23:00:35.18

>>567

５６６と５６３は同一人物だと仮定しているのか？

570

： １３２人目の素数さん [sage] 2011/10/30(日) 23:37:00.16

>>488

製薬会社と品質管理に関心があるというのは、専門課程前の薬学部生なのですかね？
製薬業特有の統計学用途は、新薬の薬効評価時の統計的検定でしょうね。
新薬実験データから薬効有無を証明する手法としての役割ですね。
品質管理への応用は、統計的品質管理（ＳＱＣ）として応用統計学の１分野を
占めています。品質管理が必要とされる製造業では、どの企業でも利用されていますね。
数千個とかの量産品の品質を全数検査するのには多大な時間を要するので、少数の代表品を
検査して全数の品質合否を推測するのに統計学を使うわけです。

571

： １３２人目の素数さん [sage] 2011/11/03(木) 22:34:23.43

>>551

>このときの母平均が2である確率は・・・・・
母集団が正規分布と仮定して、2以上の確率なら算出できるが、ぴったり2.0で
ある確率は0ですね。

572

： １３２人目の素数さん [sage] 2011/11/11(金) 23:18:15.71

X軸対数でヒストグラムを描きたいのですが
このときビンのサイズは、リニア軸で等間隔にするのか、Log軸で等間隔にするのか
どちらがよいのでしょう？

573

： １３２人目の素数さん [sage] 2011/11/12(土) 00:16:05.20

対数を取る以上、対数軸で等間隔じゃね？

574

： １３２人目の素数さん [sage] 2011/11/12(土) 11:25:38.94

それぞれ別の指標をZ得点（いわゆる偏差値）で標準化してそれらを平均して一つの指標を作ろうと
思っているのですが、これで出てくる指標って意味のある数字になりますかね？

またその際の平均は加重平均でいくつかの指標に重みをつけたいと思っているのですが
その際の重みの目安などはありますか？

かなり抽象的な質問になってしまい申し訳ありませんが、特に前者の質問よろしくお願いします

575

： １３２人目の素数さん [sage] 2011/11/12(土) 16:01:49.22

ttp://www20.atpages.jp/cazzo/kyodai/kyodai.html

576

： １３２人目の素数さん [sage] 2011/11/12(土) 18:16:08.47

>>574

前者：なるっしょ。
ただし、ものによりけり。数学の成績・英語の成績・体重の3つでやっても「意味」はないっしょ。
しかし、数学・英語・国語なら意味はあるっしょ。
あと、他の指標とは異なる分布の指標が入るとまずいとか。

後者：主成分分析なんかでどうすか。
つか、最初の「別の指標」を主成分分析して主成分得点を使うってのはいかが？
数学・英語・国語をz化してから主成分分析しても、
素点で主成分分析しても結果は同じ(相関係数行列から出発するやり方なら)のはず。

平均や分散が大きく異ならなければ、単純な足し算が一番手軽だとは思うけど、
それを受け取った人が「もっとそれらしい数字を出せ」とか言ってくるのが難。

577

： １３２人目の素数さん [] 2011/11/12(土) 22:59:53.91

都道府県別幸福度ランキングなるものが発表されたのですが、
犯罪、持ち家、貯蓄とか比較してるらしいですが、指標としてバラバラで無意味な気がします。
統計学的にどのような意味があるのでしょうか。

578

： １３２人目の素数さん [sage] 2011/11/12(土) 23:01:33.12

>>576

ありがとうございます。
各指標自体は度数分布でだいたい同じ曲線の分布になっているので大丈夫そうです。

主成分分析いいかもしれないですね。ただ新しく作った指標をあらたに重回帰等の回帰分析の
従属変数に使う際に主成分得点で出した係数だと説明力が弱くなってしまうのが懸念されます。

>.平均や分散が大きく異ならなければ、単純な足し算が一番手軽だとは思うけど、
それを受け取った人が「もっとそれらしい数字を出せ」とか言ってくるのが難。

まさにこれで学生としてはつらいところです。

579

： １３２人目の素数さん [sage] 2011/11/12(土) 23:03:42.16

>>577

いろいろな社会統計指標を合成して合成変数をつくるのは社会科学の統計分野ではよくあることですが、
基本的にはそうして作った指標を独立変数として組み込みますが、
結局それを従属変数（つまりY)にもってくるのはあまりよくないですよね。

580

： １３２人目の素数さん [] 2011/11/12(土) 23:16:35.33

581

： １３２人目の素数さん [] 2011/11/12(土) 23:33:14.99

ttp://detail.chiebukuro.yahoo.co.jp/qa/question_detail/q1475309429

582

： １３２人目の素数さん [] 2011/11/13(日) 01:20:57.80

>>577

個人的には単純に所得のみを比較したほうが幸福度を
表現しているような気がします。
しかし、何を幸福とするかは個人によって異なるので、
そのような意味を付加した結果の解釈は統計学の範疇にはいりません。

文化論とかそういう学問になりますね。
統計学とは関係ないような気がします。

統計学はあくまで分析手法に理論的な裏付けを与えることを
目的としている学問ですから、その結果に意味を与えるのは、
分析者なんです。
ですから分析者によって結果が異なることはよくあることであり、
そのような分析者によって結果が異なる場合があるということは、
それが統計学の範疇を超えているという意味でもあります。

だから、それをこのスレで質問すること自体が意味ありません。
むしろ、文化論などのスレで質問する内容だと思います。

583

： １３２人目の素数さん [sage] 2011/11/13(日) 02:39:40.92

>>582

＞個人的には単純に所得のみを比較したほうが幸福度を
＞表現しているような気がします。

物価を考えずに？

584

： １３２人目の素数さん [sage] 2011/11/13(日) 09:32:20.22

続きは文化論で

585

： １３２人目の素数さん [sage] 2011/11/13(日) 16:40:02.94

>>583

都道府県レベルなら統計局に物価調査の統計データあるから使えばいいのにね。

586

： １３２人目の素数さん [sage] 2011/11/13(日) 22:02:27.71

>>582

> 個人によって異なるので、そのような意味を付加した結果の解釈は統計学の範疇にはいりません

統計学の範疇とは何のことを言っているのかよくわからない。

587

： １３２人目の素数さん [sage] 2011/11/13(日) 23:43:04.20

数理統計学なんじゃね？

588

： １３２人目の素数さん [sage] 2011/11/14(月) 02:28:45.89

統計の各分野での応用は、それぞれの分野の問題なので
個人だなんだと言う前にすべて統計学の範疇外だな。

589

： １３２人目の素数さん [sage] 2011/11/15(火) 00:19:58.82

すみません。お伺いいたします。
a+b+c＝1 になる数があって、a,b,cでそれぞれ分布関数を作っております。
aが大きければ、bが小さくなるということを検定したい場合は、t検定、カイ二乗検定
相関分析のうちどれを用いたらよいでしょうか。

590

： １３２人目の素数さん [] 2011/11/16(水) 11:26:30.06

>589

ｃは関係ないだろう。

ａ，ｂの検定は相関検定。
フィッシャー逆変換で統計量を求める。

591

： １３２人目の素数さん [sage] 2011/11/16(水) 18:07:02.55

お伺いしたいことがあるのですがよろしいでしょうか？
学校での成績処理で素点、小問正答、領域等のデータから様々な切り口で数字を見たいと思っています。
そうするにあたって何か適当な書籍はご存知ないでしょうか？
まだまだ始めようと思ったばかりで手付かずですので、入門的なものから応用的なものまで教えていただけると助かります。

ずいぶん昔ですが、学生の頃に鈴木先生、山田先生が書かれている数理統計学の本で勉強したことはあります。
よろしくお願いします。

592

： １３２人目の素数さん [] 2011/11/16(水) 20:58:09.46

「推定量の分散が小さいほど『良い』」という考え方が今ひとつわかっていません。
「分散が小さいほど、真のパラメータ候補を絞り込める」的な解釈でよいんでしょうか？

593

： １３２人目の素数さん [sage] 2011/11/16(水) 21:58:02.46

それでいいんじゃね。

594

： 589 [sage] 2011/11/17(木) 00:34:43.04

>>590

ありがとうございました。

595

： １３２人目の素数さん [] 2011/11/17(木) 20:36:28.62

経済学部1年、数IIIC未習
統計学の本は何がいいのか？

596

： １３２人目の素数さん [sage] 2011/11/18(金) 00:21:10.42

授業で教科書指定はないのか？

597

： １３２人目の素数さん [sage] 2011/11/18(金) 03:16:15.77

>>595

授業の教科書があるならまずそれを読め。
それがない、またはわからないなら
ビジネスマン向けのエクセルを使う統計入門のような本がいくつか出ているので
そういうのを読んでみる。実戦向けなので、理論は二の次になるけど、そのぶんわかりやすい。

598

： １３２人目の素数さん [] 2011/11/18(金) 14:29:46.96

電波テロ装置の戦争(始)
エンジニアと参加願います公安はサリンオウム信者の子供を40歳まで社会から隔離している
オウム信者が地方で現在も潜伏している
それは新興宗教を配下としている公安の仕事だ
発案で盗聴器を開発したら霊魂が寄って呼ぶ来た
<電波憑依>
スピリチャル全否定なら江原三輪氏、高橋佳子大川隆法氏は、幻聴で強制入院矛盾する日本宗教と精神科
<コードレス盗聴>
2004既に国民20%被害250～700台数中国工作員3～7000万円2005ソウルコピー2010ソウルイン医者アカギ絡む<盗聴証拠>
今年５月に日本の警視庁防課は被害者SDカード15分を保持した有る国民に出せ!!<創価幹部>
キタオカ1962年東北生は二十代で2人の女性をレイプ殺害して入信した創価本尊はこれだけで潰せる<<<韓国工作員鸛<<<創価公明党 <テロ装置>>東芝部品)>>ヤクザ<宗教<同和<<公安<<魂複<<官憲>日本終Googl検索

599

： １３２人目の素数さん [] 2011/11/18(金) 16:23:18.40

魂は幾何学

誰か(アメリカ)気づいた
ソウルコピー機器

テロ装置の再読願います

600

： １３２人目の素数さん [] 2011/11/18(金) 19:31:25.03

統計学を学んだ事の無い者ですが、今ある検索エンジンを作っています。
２０件みつけたら検索を終えるのですが、
データベース全体の１０％から２０件が見つかったとすれば、
全部探した場合に２００件みつかると推測できますが
この２００という数字にどれぐらい誤差が出るかは検索した割合１０％に依存しますよね。

何％まで誤差が出るかを計算する式などはあるのでしょうか？
参考にすべきURLや検索すべきキーワードがあれば教えて下さい。

601

： １３２人目の素数さん [sage] 2011/11/18(金) 21:30:22.18

雑には二項分布、正確には超幾何分布だな。

602

： １３２人目の素数さん [] 2011/11/19(土) 18:42:44.37

統計学の本を読んでいるんですが質問させてください
統計量Ｔについてなんですけど
Ｔ＝[(xバー　-　μ)√(ｎ-1)]/ｓ　と
Ｔ＝[(Xバー　-　μ)√ｎ]/ｓ　の二種類の定義があるような気がしたのですが

これはどう考えたらいいのでしょうか？
私が間違っていますか？

603

： １３２人目の素数さん [] 2011/11/19(土) 23:55:44.45

ｓが母標準偏差か標本標準偏差かによって変わってくる
その本をよくよんでみ

604

： 602 [] 2011/11/20(日) 02:17:07.09

いや、どちらもｓは標本標準偏差です

鳥居泰彦「はじめての統計学」には後者の式が書いてあって
　ｚ＝(xバー - μ)/[σ/√(n)]
　の母標準偏差σを標本標準偏差ｓに置き換えたｔは自由度ｎ-1のｔ分布をする
とあります

そういう理解でいいのでしょうか？

605

： １３２人目の素数さん [] 2011/11/20(日) 03:24:38.38

定義というのは統計学では
共通の約束事ではなくて、この本ではこう定義します、
という意味ですから、すきかってにいろんな定義が
出てきます。
だから、まあ気にしないことです。

606

： １３２人目の素数さん [sage] 2011/11/20(日) 04:26:55.24

>>602

なんか適当な回答をしてる人がいるけと、前者はないよ。

その式にでてくる、s/√nってのは、標本の分散は母分散をサンプルサイズのnで割ったものになり、標準偏差はそのルートになるってこと。

標本の標準偏差はσ/√nってのをやってるでしょ。
これは、母分散を標本から計算される不偏分散に置き換えても変わらないので、s/√nになる。

分散の方は母分散がわかっていない時は、n-1で割り不偏分散のs^2を求める。
不偏分散の計算には、n-1が出てくるけど、これを標本の分散にする時は、nで割ればいい。

結果として、以下の母分散が分かってる時の正規分布の時の式のσをsに置き換えて、自由度n-1のt検定になる。

　ｚ＝(xバー - μ)/[σ/√(n)]

607

： 602 [sage] 2011/11/20(日) 07:36:59.12

>>606

ご丁寧にありがございます
小島寛之「完全独習統計学」には不偏分散が出てこず、ｓの定義で混乱しています

要するに同じ「標本分散」s^2という記述があってもそれは
　偏差平方和/ｎ　のこともあれば
　偏差平方和/(n-1) のこともある
ということなのかな

とにかく本を読み進めてみます

608

： １３２人目の素数さん [sage] 2011/11/20(日) 12:21:29.18

>>607

標本分散には、普通の人が使うｎで割る分散と、母分散により近くなると
統計学的に確かめられているｎ-1で割る不偏分散があります。

で、普通はt検定（これから出てくるカイ２乗検定、Ｆ検定）とかの話を
するならば、分散の推定量は「自由度（ｎじゃなくてｎ-１を使う理由）」
を考えた不偏分散です。

逆いえば、母分散の推定量を自由度を考えないｎで割った単なる分散で
間に合わせているのに、自由度が絡むｔ分布を説明するのは整合性が取れ
てません。

でもって、例えば区間推定で（以下のｘはｘバーのことね）

母分散がわかっている場合、x-ｍ*[σ/√(n)]≦μ≦x+ｍ*[σ/√(n)]
母分散がわかっていない場合、x-ｔ*[s/√(n)]≦μ≦x+ｔ*[s/√(n)]

に出てくるｎは、母分散σ^２もしくはその推定量のｓ^２に対して、サンプル
から計算されたｘの平均の分散はｎで割ったものになるというのを使って、
ルートして標準偏差（σ/√(n)とかs/√(n)）を求めてるので、そのまま
サンプル数のｎを使えばＯＫ。

つまり、標本からの（不偏）分散を計算するときに考えたｎ-1と検定とか区間推定
の式の所で出てくるｎは考え方が違うんだけど、ここを混同してるんだと思うよ。

609

： １３２人目の素数さん [sage] 2011/11/20(日) 17:46:02.95

> 602

Ｔ＝[(xバー　-　μ)√(ｎ-1)]/ｓ
と
Ｔ＝[(Xバー　-　μ)√ｎ]/ｓ
とではｓの定義が異なるだけでは？

上は
s^2 = 偏差平方和/ｎ
で下が
s^2 = 偏差平方和/(n-1)
で標本分散が定義されていれば、どちらもT値は同じ。

610

： １３２人目の素数さん [sage] 2011/11/21(月) 03:47:45.76

小島寛之の本は詐欺本。
『数学を日常生活に生かす確率的発想法』って本を買ったが、日常生活で生かす内容が全く出てこない。
まじ騙された。

611

： １３２人目の素数さん [sage] 2011/11/21(月) 17:54:40.03

日常生活が狭い範囲の世界のひとには数学を生活に活かすことは難しい。

612

： １３２人目の素数さん [sage] 2011/11/21(月) 19:09:59.45

>>609

そういうことのようです
お騒がせしました
人によって記号や用語の使い方に幅があるので、いろいろな本のつまみ食いはだめですね

613

： １３２人目の素数さん [sage] 2011/11/21(月) 20:58:36.97

そういう記号は通常それぞれの本で定義されている。そこを読んだほうがいい。

614

： １３２人目の素数さん [sage] 2011/11/25(金) 21:31:19.53

>>608

>母分散により近くなると
>統計学的に確かめられているｎ-1で割る不偏分散があり・・・・・・
この表現を応用統計社内教育でも見たんだが、nでなくｎ-1で割った方が
母分散により近いというのを、どのように確かめたの？
その際のnって、どのくらい？１億？１兆？１京？

615

： １３２人目の素数さん [sage] 2011/11/25(金) 22:05:17.33

>>614

そういう確かめ方ではなく、分散の期待値の計算をすると出てくる。

ちょっと数式の多い（数理）統計学のテキストをみると、ネットでググっても
見つかると思うよ。

616

： １３２人目の素数さん [] 2011/11/26(土) 14:00:52.11

614
意味があるnはだいたい30以下だよ

617

： １３２人目の素数さん [] 2011/11/26(土) 17:55:39.66

>>610

本のタイトルなんて売るための目的で付けられる。
いわゆる「企画本」はタイトルだけで内容がない本が多いよ。
書店で手にとって内容を確認して買うようにしないとね！

統計のスレだから書いておくと、
「ベイズな予測―ヒット率高める主観的確率論の話」
宮谷隆 (著), 岡嶋裕史 (著)
という本など、近年まれにみるクソ本だ。内容はまったくなし。
著者の「宮谷隆」,「岡嶋裕史」というのは相当な馬鹿というか
低能な奴らで、ベイズ統計を全く知らないんだ。
適当にウソを馬鹿のようにちょこっと書いておわり。図書館で見てまじ驚愕した。

あと、もう一冊あげておくと、
「金融工学の悪魔―騙されないためのデリバティブとポートフォリオの理論・入門」
吉本佳生 (著)
という本もあまりのクソ本でまじびびった。
「金融時系列は正規分布するらしい！けど実際はちがうんだぜ！」
という１行で済むことを一冊の本にした、歴史に残るクソ本。
しかも、アマゾンＩＤ複数から絶賛のコメント書きまくり。
吉本佳生には即死んで欲しい。

などなど、企画本は腐るほどあるので、気をつけたほうがいいです。

618

： １３２人目の素数さん [sage]] 2011/11/27(日) 02:02:29.36

どんな歴史だよｗｗ

619

： １３２人目の素数さん [sage] 2011/11/27(日) 16:46:22.20

統計を独学したいです。
なお高校数学B、数学Cなどにある基礎的な統計については学習しています。
その高校数学以上で次にどういったもの本を読めば
いいかお勧めありましたら教えていただけますか？
ゆくゆくは、ベイズやRについて理解したいですが、
まだそこまではって感じです。

欲をいいますと、高校の数学教科書のように体系つけられているもの。
またこれとは別に、エクセルで学べる補助的な本があれば知りたいです。

620

： １３２人目の素数さん [sage] 2011/11/27(日) 20:13:55.00

さて、また統計学の正当性が試されてますよ。

統計学によって開票開始0分、開票0%で当選確実と予測しました。
外部リンク

ttp://up2.pandoravote.net/up24/img/pan2jij00014111.jpg

外れたら統計学は笑いものです。

621

： １３２人目の素数さん [sage] 2011/11/27(日) 20:37:27.69

>>620

要するに開票するまでもなかったってことですね。

622

： １３２人目の素数さん [sage] 2011/11/27(日) 20:51:48.33

出口調査から予測する→サンプルサイズによって、誤差がほぼわかる。→その誤差以上の差がついていることがわかる。
→当選確実
こういうことだろ。

623

： １３２人目の素数さん [sage] 2011/11/28(月) 00:05:24.37

事実その通りの結果になったしな。
ただ過去に当選確実で外れたことはあるよ。
当選確実って100%ってことじゃないからな。

624

： １３２人目の素数さん [sage] 2011/11/28(月) 11:28:31.38

確率100%のときに外れる可能性はあるかないかという問題では、
可能性があるというのが数学だからな。

625

： １３２人目の素数さん [sage] 2011/11/28(月) 11:35:57.64

>>624

そういう話じゃないでしょ。

>>620

統計学がわかってたら、そういうコメントにはならない。

TVの説明でも「事前の情報から当選の可能性が高いということであって
違う場合もあります」って説明してた。
そういう説明をするなら、「確実」って言葉を使うなとは思う。ｗ

626

： １３２人目の素数さん [sage] 2011/11/28(月) 11:42:28.85

正しいサイコロの目が1を出す確率は1/6であることは100％確実である

627

： １３２人目の素数さん [sage] 2011/11/28(月) 12:05:27.66

これは国家メディアの統計学の乱用。
開票開始0分、開票0%で当選確実とNHKが報道するのは捏造報道以外のなにものでもない。

NHKはこういう捏造報道の前科がたくさんある。
首相不信任案投票の直前に、首相が辞任とは一言も言っていないのに、辞任表明と報道したり、
新首相を決める民主代表選のときに、決選投票直前に馬渕が野田を支持という嘘を報道したり、
NHKは政治に介入するために積極的に捏造報道してるとしか思えない。

628

： １３２人目の素数さん [] 2011/11/28(月) 16:28:36.08

　　有意水準とベイズの意味が分かっていない人が多いな…。

　　開票０％での当確（p値が有意水準以下）であっても、
　　一定の確率で結果が反転する。

　　統計学を学んだ人には、常識中の常識、であると思うのだが、。。。。。

629

： 619 [] 2011/11/28(月) 16:38:16.51

すいません。
オススメの本ありませをか？
(-_-#)

630

： 猫は村瀬氏の弟子 ◆MuKUnGPXAY [age] 2011/11/28(月) 16:46:52.09

>>627

その「当確を出す」という行為の根拠はどうやら『投票所での出口調査』
だそうですけどね。だからソコは然程の批判には値しないとは思います。
でも未確認情報の報道や虚偽報道は糾弾されるべきでしょうね。尤もコレ
はアメリカでもありますけど。

日本のマスコミは無茶苦茶ですから。

猫

631

： １３２人目の素数さん [] 2011/11/28(月) 17:14:21.23

　①選挙日前の事前調査で事前分布を得る

　　②出口調査の結果で、事前分布をベイズ更新

　　　③開票途中データで、さらに事前分布を更新

　　　④予想当選確率が閾値を超えた時点で当確

テレビ局による違いは、利用している

　　事前調査の分布
　　出口調査データ
　　閾値（有意水準）

が違うことによって起こる。
機械的なことなので、誰が悪いとかはない。　　

強いていえば、「当選確実」ということばが不適切。

632

： １３２人目の素数さん [] 2011/11/28(月) 17:16:33.42

　　当確が外れることを「悪」だというのならば、

　　有意水準を厳しくすればいいだけだが、

　　そんな選挙報道を国民が望んでいるかどうかだな。

633

： 猫は村瀬氏の弟子 ◆MuKUnGPXAY [age] 2011/11/28(月) 17:16:44.46

ではどういう言葉が適切かと？

猫

634

： １３２人目の素数さん [] 2011/11/28(月) 17:43:24.35

当選ほぼ確実
では駄目ですかね。

635

： １３２人目の素数さん [sage] 2011/11/28(月) 17:45:46.88

開票0分で速報出すということは、
はじめから0分に出すという恣意的な政治的意思がなければできない。

それを国民が望んでるって？　そんなくだらないこと国民が望むものか。
当選確実速報は当選速報ではないのだ。

636

： １３２人目の素数さん [] 2011/11/28(月) 17:52:16.14

選挙速報があろうとなかろうと、投票は全部開示するんだろ。
意図的に誤報を出すことにどんな意味があるんかね。
寧ろ誤報によって局の信頼性が只落ちるだけだと思うが。

637

： 猫は村瀬氏の弟子 ◆MuKUnGPXAY [age] 2011/11/28(月) 18:00:23.27

>>634

その方が少しはマシですかね。ではNHKに進言してみてはどうでしょうか。

猫

638

： １３２人目の素数さん [sage] 2011/11/28(月) 18:17:47.49

99.5%の確率なら、
当選確実の200人の議員のうち一人がぬか喜びすることになるだろう。

639

： １３２人目の素数さん [sage] 2011/11/28(月) 18:23:45.23

>>636

NHKは、積極的に政治に介入してまで、保身したいということ。
今回は、利権を守るために自民と民主と共産と総連が手を組んだ。

統計学の悪用には目を光らせないとな。

640

： １３２人目の素数さん [] 2011/11/28(月) 18:26:44.14

確実って確かで間違いないって意味だったので、当選確実って無理あるね。
せめて開票してから未開票分を反対票に足しても順位が変わらない時に当選確実って言葉を使うといいのに。

641

： １３２人目の素数さん [] 2011/11/28(月) 18:29:51.15

誤報出すことが、政治に介入？
馬鹿なのか、想像力豊かなのか、どちらかだな。

642

： 猫は村瀬氏の弟子 ◆MuKUnGPXAY [age] 2011/11/28(月) 18:32:26.31

>>640

ソレは確実ではなくて確定ですよね。

猫

643

： １３２人目の素数さん [] 2011/11/28(月) 18:55:43.90

>640
そうですね。
確定はなんとなく、完了的なニュアンスあるけど。
確実というのは、今現在においては、というニュアンスがあるような気がしますね。

644

： １３２人目の素数さん [] 2011/11/28(月) 19:00:58.59

そう思えば、確実でもいいのか。と思った(笑)。

645

： １３２人目の素数さん [sage] 2011/11/28(月) 19:06:36.44

>>636

自分も「速報」にまったく意味を感じませんね。速報するために投票用紙を開きやすい特別な
ものにするとか、人を多く投入するとか税金の無駄遣いと思う。

646

： １３２人目の素数さん [sage] 2011/11/28(月) 19:11:03.18

ただ今回は速報知りたがる人が大勢いた。
開票8時にアクセスが殺到してニュー速の2chサーバが落ちた。

647

： １３２人目の素数さん [] 2011/11/28(月) 19:12:19.63

　なんか、ぜんぜん統計がわかっていない人がひとり紛れてますね。

　開票前であろうと、調査データをもとに事前分布を推計することはできます。
　
　真のデータがないと、推計ができない、と思っているのでしょうか？

　選挙とかNHKとか、そういう問題ではなく、
　統計ではごく普通に使われている手法なんですが…。

　何が「悪用」なのでしょうか？　事前分布を使うこと？　当確と確定を混同して報道すること？

648

： １３２人目の素数さん [] 2011/11/28(月) 19:19:09.22

速報は、選挙民の為というより、マスコミ同士のスクープ力の競争なのかもね。
何処が一番速く当確を出せるか？みたいな。
もちろん、誤って出したら大幅減点。
マスコミ各社の情報収集力と、正解な判断力を問われる、もう一つの競争なのかもしれない。

649

： １３２人目の素数さん [] 2011/11/28(月) 19:22:00.24

>647
そういう、話ではないと思う。
但し、スレ違いなのだが。

650

： １３２人目の素数さん [sage] 2011/11/28(月) 19:30:06.15

なんでもスレだからスレ違いではないんじゃない？
しらんけど

651

： １３２人目の素数さん [sage] 2011/11/28(月) 19:30:44.13

>>647

まったくズレてるよ。

652

： １３２人目の素数さん [sage] 2011/11/28(月) 19:36:42.03

>>648

あぁ、そうかもね。

653

： １３２人目の素数さん [] 2011/11/28(月) 20:43:34.36

>何処が一番速く当確を出せるか？みたいな。

事前調査で当選が決まっているようなケースでは、
投票終了時となるので、競争はないでしょう。

投票終了前だと違反だ。

今回の大阪だと、ひょっとして、という人もいたかもしれないけど、
前回の東京都知事選など、投票終了直後・開票率０％で、石原当確に
誰も違和感は持たなかった。

654

： １３２人目の素数さん [sage] 2011/11/28(月) 20:57:27.38

>>635

＞そんなくだらないこと国民が望むものか

そうか？

655

： １３２人目の素数さん [sage] 2011/11/28(月) 21:00:16.78

むしろ違和感があるのは、あれだけ批判されている石原他が選ばれることに違和感を持たいない有権者の方

656

： １３２人目の素数さん [] 2011/11/28(月) 21:36:58.51

>>653

確かに、事前に判りきっているならばね、もちろん競争にはならないけど。
そうじゃないものも多くて、選挙は複数あるでしょ。
特に統一地方選挙とか、衆議院参議院同一選挙とか。
ある意味、日本全国お祭りで、マスコミ特にニュース部門にとってはビッグイベントだと思うのね。
当確っていうのは、ビッグイベントの中でもっても注目される場面。
ここに、マスコミが力入れない筈はないと思う。

統計で使う数式は同じでも、出口調査の標本の数とか、事前のリサーチとか、そんなこんなで、マスコミの情報収集力の差がでてくるわけで。
そう思えば、今回起きた日テレの投票終了前の当確テロップフライング事故みたいな事が起こっても不思議ないなぁ。

とまぁ。ぜんぶ想像ですがね。

657

： １３２人目の素数さん [sage] 2011/11/28(月) 21:50:17.24

星印を並べる→p値を明記する→信頼区間を計算する
って具合に変わってきたわけだ。
だから、
当選確実→当選確率○%→得票何票(誤差±○票)
って感じで書くようになるんじゃないの。
(本紙・本局調べの出口調査による)と書いておけば問題なかろう。

658

： １３２人目の素数さん [] 2011/11/28(月) 21:54:22.35

選挙報道って不毛かと思ったけど、お祭りにする事で、いくらかの投票率をあげてるのかもね。
だって、こういう報道がなくなると、まったく無関心な人が増えるだろうし。
当確間違いも、ある意味面白い。

659

： 猫を合法投棄してよ ◆MuKUnGPXAY [age] 2011/11/28(月) 22:00:21.70

まあ「天気予報の降水確率」みたいなモンですかね。甲子園球場のお弁当
屋さんに取っては大事な情報なんでしょうけど。

猫

660

： １３２人目の素数さん [] 2011/11/28(月) 22:18:44.42

そういえば降水確率は何を表してるんですかね。
50%あれば、雨が降らない日とかなかったよぅな気がするけど。
気のせいかしら。

661

： 猫を合法投棄してよ ◆MuKUnGPXAY [age] 2011/11/28(月) 22:23:03.33

>>660

そういうのは私みたいなド素人には極めて疑問に思える事柄なんですよ。
そもそもその数値はどういう方法で算出されるんですかね。加えてその
数値が正しいかどうかの精度はどう理解すればいいんですかね。

猫

662

： １３２人目の素数さん [] 2011/11/28(月) 22:29:54.23

過去の天気予報の降水確率と、過去実際の天気データを比べてみたら面白いかもですね。

663

： 猫を合法投棄してよ ◆MuKUnGPXAY [age] 2011/11/28(月) 22:39:27.22

>>662

そういうデータはきっと気象庁が自分で持ってる筈ですよね。何故ならば
自分達の予報の正確さに関する問題なので。

猫

664

： １３２人目の素数さん [sage] 2011/11/28(月) 23:38:58.52

投票時間締め切り後に開票0％でどんな予想を出そうが、結果に影響はない。
統計学うんぬんの前に、開票率0％で統計学における批判ではないことで批判してるやつって、なぜ統計学を学んだりしてる能だろうか。
無駄でしかないのに。

665

： １３２人目の素数さん [sage] 2011/11/28(月) 23:54:00.78

>>660

気のせいです。
翌日予報ぐらいになると真面目に集計したら大体50%になります。
（一定時間内に1mm以上の雨が降った場合ね。）

666

： 猫は無職のアホ ◆MuKUnGPXAY [age] 2011/11/29(火) 00:04:31.95

>>665

なるほど。「何を以て雨が降ったと定義するのか」にも依存しますよね。

猫

667

： １３２人目の素数さん [sage] 2011/11/29(火) 00:36:20.39

>>604

みんな、統計学とは違う意味で批判してるだけだと思います。
あなたも少しズレてますね。

668

： １３２人目の素数さん [sage] 2011/11/29(火) 01:37:05.60

>>656

＞当確っていうのは、ビッグイベントの中でもっても注目される場面。
＞ここに、マスコミが力入れない筈はないと思う。

そこが最も注目されるようにしているのはマスコミ自身ではないですかね。
本来、最も注目が行くものは当確ではなく当選でしょう。

669

： １３２人目の素数さん [] 2011/11/29(火) 04:58:26.64

ほ！

670

： １３２人目の素数さん [sage] 2011/11/29(火) 07:40:28.92

降水確率もそうだが、個々の統計値がどういう定義をされてるかというのは重要。
例えば、大学の偏差値を勘違いしてるゆとりかあまりにも多いとか。

団塊Jr世代の受験戦争では、偏差値50以下の大学なんてほとんどなかったと言っても
全入世代のゆとりは偏差値なんだからあり得ない、
偏差値の意味を知らないアホとかいう頓珍漢なレスを返す。

671

： １３２人目の素数さん [sage] 2011/11/29(火) 11:04:59.15

なんだか思いついたことをそのままの順番で書き綴ったような文章だな

672

： １３２人目の素数さん [sage] 2011/11/29(火) 11:43:10.03

ゆとりは馬鹿だから仕方ない。

673

： １３２人目の素数さん [] 2011/11/29(火) 11:58:03.49

>>668

早く結果を知りたい人が多数いる限り、報道の価値としては、当選の事実より、当確に重きを置くのは当然だと思います。

674

： １３２人目の素数さん [] 2011/11/29(火) 12:15:56.47

団塊Jr.だが、偏差値50以下の大学がなかった、というのはない。
但し、底辺校と言われた学校の偏差値が異常に高くなっていたのは思い出す。
俺の通った、専修大学なんて、いまではFランクなんだろうな。(T_T)

675

： １３２人目の素数さん [sage] 2011/11/29(火) 13:37:50.67

専修大学出身のボクシング世界チャンピオンが生まれたんだ
喜べよ

676

： １３２人目の素数さん [sage] 2011/11/29(火) 14:27:18.20

いるな。大学の偏差値が大学の順位の偏差値と勘違いしてる奴。

677

： １３２人目の素数さん [sage] 2011/11/29(火) 14:44:46.95

大学の順位についてを偏差値にする？
何を言ってるか、意味不明。

678

： １３２人目の素数さん [] 2011/11/29(火) 14:50:12.48

たぶん、大学の順位って北から本校がある大学を並べた順番のつもりだろう。

679

： １３２人目の素数さん [] 2011/11/29(火) 14:55:36.61

ちょうど名古屋大学あたりがメディアンだろ。

680

： １３２人目の素数さん [sage] 2011/11/29(火) 15:04:44.88

普通に悪意なく、通訳すれば。
模試結果で表れる、大学と試験結果の偏差値対応表は、大学の価値・ブランドを示しているのではない。
と言いたかったはず。

681

： １３２人目の素数さん [sage] 2011/11/29(火) 15:06:25.94

大学の価値は数値化されているものなのですか？

682

： １３２人目の素数さん [sage] 2011/11/29(火) 15:07:48.13

数値化の一例：偏差値

683

： １３２人目の素数さん [sage] 2011/11/29(火) 15:09:31.32

いや、

>>677

が大学の順位とは何かを説明せねば、意味不明。

684

： １３２人目の素数さん [sage] 2011/11/29(火) 15:12:39.74

オマエラ、もういいだろ。許してやれや。

685

： １３２人目の素数さん [] 2011/11/29(火) 15:23:22.66

順位についての偏差値なのだから、ど真ん中が標準値でありメディアンでもあり平均値でもある。
で各偏差は一つずつ＋するか、－加えればいい。

686

： １３２人目の素数さん [sage] 2011/11/29(火) 15:31:10.23

なんだ？
統計学スレに、大学偏差値について、ウンチク語ろうとしたら。
返り討ちされたみたいな。感じ？

687

： １３２人目の素数さん [sage] 2011/11/29(火) 15:50:07.98

もしか

>>670

= 676
か、なら納得。

688

： １３２人目の素数さん [sage] 2011/11/29(火) 15:51:57.84

許してやれよ…

689

： １３２人目の素数さん [sage] 2011/11/29(火) 16:37:07.38

>>677

意味不明だろ？
ゆとりは順位から偏差値を計算できると勘違いしてる。

690

： １３２人目の素数さん [sage] 2011/11/29(火) 16:38:57.90

>>686

だれがいつ返り討ちにされたんだよ？w ゆとりか？w

691

： １３２人目の素数さん [sage] 2011/11/29(火) 16:42:40.47

ゆとりは馬鹿だから仕方がない。

692

： １３２人目の素数さん [sage] 2011/11/29(火) 16:47:34.59

昔は分数できない大学生が～だったのに、今は四則演算できない大学生が～だからな。

全入世代こえ～

693

： １３２人目の素数さん [] 2011/11/29(火) 18:26:59.55

今の人間て生きていて何が楽しいの？

694

： 猫は片輪 ◆MuKUnGPXAY [age] 2011/11/29(火) 19:23:05.79

>>693

ソレはどうやら「自分の目標を思いっきり低く設定するから」という様な
話だそうです。

猫

695

： １３２人目の素数さん [sage] 2011/11/29(火) 20:34:25.66

鬱になる人は目標が高いからって化猫が言ってた。

696

： １３２人目の素数さん [sage] 2011/11/29(火) 22:19:39.64

>>670

>偏差値50以下の大学なんてほとんどなかった

ってどういう意味？

697

： １３２人目の素数さん [sage] 2011/11/30(水) 00:33:08.61

>>696

極端に偏差値が悪すぎる大学が数校あって、
あと大多数は偏差値が50以上あったて事じゃない？
それか、

>>670

がゆとりかのどちらかだ。

まあ正規分布の形にはならんなあ。

698

： １３２人目の素数さん [sage] 2011/11/30(水) 02:21:37.46

偏差値も正規分布するのも、大学ではなくて、受験生がだろ。

大学の偏差値が５０以下なのではなく偏差値５０以下の受験生が行ける大学が
あんまりなかったってこと。
大学への進学率もだいぶ低かったし。

699

： １３２人目の素数さん [sage] 2011/11/30(水) 07:08:59.72

>>697

ゆとりはおまえみたいに勘違いしてることだよ。
おまえのように大学の偏差値の定義を知らず、妄想で論理展開する。
ゆとりもおまえと同じように言葉を定義せず、論理展開する非科学的思考がデフォになってる。

700

： １３２人目の素数さん [sage] 2011/11/30(水) 07:26:17.95

数学板の統計スレで、一般にいう「大学の偏差値」という統計値は、
偏差値ではなく、その大学に合格した学生の偏差値の平均値だということを知らない馬鹿っているんだな。

偏差値じゃないことは、まじめに統計学やってりゃすぐ気づくんだけど。
数学板住人がこんな簡単なひっかけに引っかかるとは恥ずかしいw

701

： １３２人目の素数さん [sage] 2011/11/30(水) 08:31:12.15

ゆとりは馬鹿だから仕方がない。

702

： １３２人目の素数さん [sage] 2011/11/30(水) 09:03:11.32

>>700

>合格した学生の偏差値の平均値

その偏差値ってどこから求めてるの

703

： １３２人目の素数さん [sage] 2011/11/30(水) 09:51:44.37

模試。だから大学の偏差値は、模試やってる予備校が発表するし、
予備校ごとに発表する大学の偏差値は違う。

受験生なら常識なんだけど、ここって大学生やら大卒っていないの？

704

： １３２人目の素数さん [sage] 2011/11/30(水) 10:30:56.79

>>700

ひっかけか？

>>670

は定義が重要で、みな勘違いしてるって初めから言ってるじゃん。

705

： １３２人目の素数さん [] 2011/11/30(水) 12:01:12.79

なんか、話題のレベルが下がってきたね。

　>698　の
　>偏差値も正規分布するのも、大学ではなくて、受験生がだろ。

　とか、勘弁してほしい。

706

： １３２人目の素数さん [sage] 2011/11/30(水) 14:36:19.56

学歴の話は荒れるな。

707

： １３２人目の素数さん [たすけて] 2011/11/30(水) 17:13:52.78

　　はげました。
　　　＿＿＿＿
　／／~　　~＼:＼荒れるな。もっと正確に書いて下さい。
　｜ (●)　(●) :｜
　｜　ノ(＿)ヽ ::｜
　｜　`-=ニ=-′::｜いけめんの男前だ。
　＼　 `＝′ ::／
　／｀ー――-´＼

708

： 猫は片輪 ◆MuKUnGPXAY [age] 2011/11/30(水) 17:22:52.24

学歴が無意味だという事が誰も判ってない馬鹿な国。

猫

709

： １３２人目の素数さん [sage] 2011/11/30(水) 17:28:01.27

存在が無意味な猫

710

： 猫は片輪 ◆MuKUnGPXAY [age] 2011/11/30(水) 17:32:25.01

>>709

そんな事はちゃんと知ってます。ですが私が数学板から立ち去る事はアリマセン。

猫

711

： １３２人目の素数さん [sage] 2011/11/30(水) 19:36:58.75

>>697

これはひどい。頓珍漢なレスとはこのことだな。
大学の偏差値を偏差値と思ってるなんてほんとゆとりらしいや。

712

： １３２人目の素数さん [sage] 2011/11/30(水) 19:38:22.85

>>705

それはあってるだろw

713

： １３２人目の素数さん [sage] 2011/11/30(水) 20:46:32.41

>>700

＞その大学に合格した学生の偏差値の平均値だ
普通は、最低点というか、合格ラインなんじゃないの
平均じゃ大学選びの目安にしにくいじゃん。

たとえば、「偏差値55」という大学があったとしたら、合格ラインが55だというのなら53の受験生はもうちょいがんばろうと思うかもしれんが、
平均が55なら、さらにその標準偏差もわからないと自分は受かりそうかどうかわからんし、上に外れ値があったら平均値は代表値にはならんし。

714

： １３２人目の素数さん [sage] 2011/11/30(水) 21:09:04.45

ゆとりには合格者の偏差値の平均は目安にならないのか。

┐(´д｀)┌ ヤレヤレw

715

： １３２人目の素数さん [sage] 2011/11/30(水) 21:11:53.47

ちょっと話はズレるけど
何でもかんでも平均値を求めておけば（平均値さえ求めておけば）いいって風潮は気になる

716

： １３２人目の素数さん [sage] 2011/11/30(水) 21:57:43.43

>>714

こういうのが、「サラリーマンの平均年収は○万円」とか「平均貯蓄額が○百万円」なんて週刊誌のヨタ記事を見て冷や汗たらすんだろうなあ
気の毒に。

河合塾の場合「ボーダーラインは河合塾が予想する合否の可能性が50％に分かれるライン」
代ゼミの場合「各大学の2次試験（個別試験）の合格レベルの予想」(国公立2次について)
駿台の場合「駿台偏差値ランキング(合格目標ライン)」

>>713

の「最低点」というのも正しいとは言えないようだが、「平均」は明らかに違う。
どういう根拠で「平均」と結論づけられたのか、そちらこそ興味深い。

717

： １３２人目の素数さん [sage] 2011/11/30(水) 22:39:58.97

ゆとりは馬鹿だから仕方がない。

718

： １３２人目の素数さん [sage] 2011/11/30(水) 22:41:40.32

>>716

大学受験したことないの？　いくらなんでもキミ無知杉。

719

： １３２人目の素数さん [sage] 2011/11/30(水) 22:48:41.90

なに？今度は平均値の意味が分からないゆとりが暴れてんの？

720

： １３２人目の素数さん [] 2011/11/30(水) 23:51:07.91

>712

　偏差値は正規分布にはならない。

721

： １３２人目の素数さん [sage] 2011/12/01(木) 00:29:30.35

>>713

偏差値を出してるとこによって多少は異なるが、６割合格の偏差値であることが多い

722

： １３２人目の素数さん [sage] 2011/12/01(木) 00:30:46.29

>>720

またわけの分からないことを言い出す奴が

723

： １３２人目の素数さん [sage] 2011/12/01(木) 00:34:11.53

>>720

>>698

を見てそう反論するなら、まず統計より前に、国語を勉強してこい。

724

： １３２人目の素数さん [sage] 2011/12/01(木) 00:36:15.79

統計学って、いろんなバックグラウンド持った人達（学力も様々）が勉強するせいか、
認識に齟齬が出やすいね

725

： １３２人目の素数さん [sage] 2011/12/01(木) 00:36:21.18

>>720

梯子が付いてるのも赤いのもパトカーでなくて消防車だろ

梯子は赤くない

↑今ここ

726

： １３２人目の素数さん [sage] 2011/12/01(木) 11:51:47.48

大手の全国模試データって生で見られる
ところある？どれくらい歪んでるのかしら

727

： １３２人目の素数さん [sage] 2011/12/01(木) 12:10:55.44

>>726

中学生？　模試受ければ分かるよ。

728

： １３２人目の素数さん [sage] 2011/12/01(木) 13:12:21.37

生で見る、というのが何を指しているのかによる

729

： １３２人目の素数さん [] 2011/12/01(木) 16:00:10.61

偏差値←標準化はしているが正規化はしていない。

　標準化と正規化の違いが分からない人は退場

730

： １３２人目の素数さん [sage] 2011/12/01(木) 16:02:27.96

正規化って何？
色々な分野で別の意味持つんだけど

731

： １３２人目の素数さん [] 2011/12/01(木) 17:20:16.20

　標準化　1次モーメントと２次モーメントを規格化。
　　
　　　　　→偏差値の場合、１次モーメントが５０、２次モーメントが（１０）^2

　正規化　３次以上の高次モーメントも規格化

　　　　　→狭義には歪度を０、尖度を３（定義によっては１）にすること。
　　　　　　　５次モーメント以上はあまり関心が持たれない。

　偏差値は標準化の結果得られる数値なので、正規分布には従わない。

732

： １３２人目の素数さん [] 2011/12/01(木) 17:22:03.66

　↑　注）一次元データの場合

733

： １３２人目の素数さん [sage] 2011/12/02(金) 09:28:34.30

世論調査みたいな感じで3800の調査で母集団2億の動向を探るって妥当？
調査対象が充分すぎるとか少なすぎるとかある？

734

： １３２人目の素数さん [sage] 2011/12/02(金) 09:53:28.68

十分過ぎる。3800人と100万人の誤差を比べれば分かること。
100万人調査することは無駄骨でしかない。

735

： １３２人目の素数さん [sage] 2011/12/02(金) 10:39:01.39

3800人と100万人の誤差って言われてもよくわからないんだけどね
ラジオ聞いてたら3800の調査で2億の動向わかるのかよっていう感じのコメントしてる経済記者がいたからどうなのかなと思った

736

： １３２人目の素数さん [sage] 2011/12/02(金) 15:03:17.20

>>735

きちんとした調査なら3800人でも十分。
ただ、調査の仕方が悪くて聞く人が偏っていると、結果が信用できない。

例えば、電話で昼間に調査したら、答えるのは主婦ばかりになるとかね。
２億人全体のバランスと合うように、年齢階層とか収入の分布とかを作ったグループで
調査しないとだめ。
質問するグループをきちんと作ったとしても、みんなが答えてくれるわけじゃないので、
一部の人が関心があって答えたいような質問だと回答率が下がって結果も偏る。

737

： １３２人目の素数さん [sage] 2011/12/02(金) 15:20:48.39

きちんと抜き出すなら２０００人もやれば十分なんだが
街頭調査や電話口調査ではとても偏りなく抜き出したとは言えない。

経済記者は、そういうことが言いたいのか馬鹿なのかのどちらか。
おそらく後者。

738

： １３２人目の素数さん [sage] 2011/12/02(金) 15:29:02.49

実際にサイコロで3800回と100万回振って、1が出る確率を比べてみるといい。

739

： １３２人目の素数さん [sage] 2011/12/02(金) 16:27:53.14

宝くじを3,800円分と１００万円分買ってみれば
少数事例では3,800くらいじゃ全く役に立たないこともわかるぞ。

740

： １３２人目の素数さん [sage] 2011/12/02(金) 16:46:53.74

え？　3800円でも十分1等が当る確率の近似値になるけど？

741

： １３２人目の素数さん [sage] 2011/12/02(金) 17:31:00.16

計算しやすいように1回100円の宝くじだとして、3800円分38回買う。一等当選確率理論値が0.001%とする。
まぐれで1等一本当っても1/38=約2.6%、すべて外れてたら確率0%
3800回どころか38回でこの程度の誤差。

742

： １３２人目の素数さん [sage] 2011/12/03(土) 05:37:31.35

>>737

２０００人どころか100万人規模の予測でも標本数は数百人で十分と、以前統計啓蒙本で
見た記憶があるのですが、許容誤差に応じた最小標本数の算出はどのような式で求める
のですか？
掲載Webページか書物かを、紹介して頂けませんか。

743

： １３２人目の素数さん [sage] 2011/12/03(土) 05:57:57.37

>>741

＞一等当選確率理論値が0.001%とする。

随分良く当たる宝くじだな。それなら少数でも役に立つだろう。

744

： １３２人目の素数さん [sage] 2011/12/03(土) 12:30:56.90

>>473

どんな確率でも同じだっつーの。

745

： １３２人目の素数さん [sage] 2011/12/03(土) 14:58:34.58

同じじゃないだろ。何いってんだ。

746

： １３２人目の素数さん [sage] 2011/12/03(土) 15:02:14.88

測度変換で確率なんていくらでも変わっちゃうもんねって意味？

747

： １３２人目の素数さん [sage] 2011/12/03(土) 15:04:56.21

１０％の確率で起こると予測したものが
実際には１１％だったときには
その誤差は１％ですか１０％ですか？

748

： １３２人目の素数さん [sage] 2011/12/03(土) 15:05:38.00

>>745

？　算数できない子？
世論調査で与党の支持率が変化するごとに、サンプル数を変えろって言ってんの？w

749

： １３２人目の素数さん [sage] 2011/12/03(土) 15:10:36.99

>>746

重回帰分析の話題じゃないの？

750

： １３２人目の素数さん [sage] 2011/12/03(土) 15:14:21.24

>>748

それが473と何の関係があるの？

751

： １３２人目の素数さん [sage] 2011/12/03(土) 15:15:10.86

>>748

与党の支持率みたいな大きなものでは問題ないよ。
全く理解せずに答えてるだろ。

752

： １３２人目の素数さん [sage] 2011/12/03(土) 15:15:50.05

>>747

ポイント使えよ

753

： １３２人目の素数さん [sage] 2011/12/03(土) 15:30:07.23

>>751

すまんが数学で頼むわ。
予測対象の確率が変化することによってなんで、サンプル数を変えなきゃならんのか。
宝くじの当選確率が0.00000001%と0.001%で誤差の差を数式でお願い。

754

： １３２人目の素数さん [sage] 2011/12/03(土) 21:18:00.90

>>751

意味が分からない。同じサンプル数で野党の支持率では問題が出るのか？

数学できないネトウヨは、支持率が高いと民意だといい、
支持率が低く出るとサンプル数が少ないから信用できないというが・・・おまえ・・・

755

： １３２人目の素数さん [sage] 2011/12/03(土) 22:49:33.14

世論調査では国民新党は支持率0だった。先の参院選獲得議席も0だった。
何か問題でも？

756

： １３２人目の素数さん [] 2011/12/04(日) 00:32:08.26

＞　数学できないネトウヨは、

よこからすまんけど、統計学に数学なんか使うな！
と声を大にしていいたい！
つか、なんで統計学スレが数学板にあるんだ？
気持ち悪いから、もう統計学スレ立てないでくれ。

757

： １３２人目の素数さん [sage] 2011/12/04(日) 04:02:44.07

>>754

与党も十分多いよ。１議席の必要票みたいな大きなものの話をしてるんじゃないんだ

758

： １３２人目の素数さん [sage] 2011/12/04(日) 15:54:55.11

>>742

過去スレに、選挙の支持率調査例題で、標本数算出法が掲載されていた
記憶があるんだが、何番スレだったかな？

759

： １３２人目の素数さん [sage] 2011/12/04(日) 21:36:17.17

>>757

このスレでおまえ一人浮いている。

760

： 31.6.183.58.megaegg.ne.jp [sage] 2011/12/09(金) 17:08:09.06

しまった

761

： １３２人目の素数さん [sage] 2011/12/11(日) 11:25:35.93

>>758

標本数算出式が過去スレ群では検出できなかったが、埼玉県庁スレにあった。
”省略された多少面倒な計算”って、どういう式を指しているのかな？
”Ｉの標本数を決定する式に行き着くまで、多少面倒な計算を
行っているのですが、ここでは省略させて・・・・”
標本数はどの程度あればよいのですか
外部リンク

ttp://www.pref.saitama.lg.jp/site/toukeifaq/q1-8.html

762

： １３２人目の素数さん [] 2011/12/13(火) 22:12:13.61

すみません、質問させてください
他スレで質問したら、統計スレでと言われましたのでココに書かせていただきます
外部リンク

ttp://nlp.dse.ibaraki.ac.jp/~shinnou/zemi2011/ml4nlp/ml4nlp-kaneta-0603.pdf
これの14Pなのですが、MAP推定の目標関数は、
logP(θ)+logP(D) = (α-1)Σlogp .....
の部分の変形が理解できません
このP(θ)はどこから来ているのかと、どのような変形または式からこの変形へ至っているのでしょうか？

763

： １３２人目の素数さん [] 2011/12/14(水) 17:41:44.41

エクセルで無相関検定ってできない？

764

： １３２人目の素数さん [] 2011/12/14(水) 23:51:08.42

日本人の統計学者の研究って実際に役に立ってるんですかね？
統計学の文献見てても日本人の名前が出てこないのですが

765

： １３２人目の素数さん [sage] 2011/12/15(木) 00:05:13.02

>>764

Akaike, Hirotugu (1974). "A new look at the statistical model identification". IEEE
Transactions on Automatic Control 19 (6): 716–723.
とか。

766

： １３２人目の素数さん [sage] 2011/12/15(木) 00:07:42.25

確かにAICは海外の論文でもよく目にする

767

： １３２人目の素数さん [sage] 2011/12/15(木) 00:34:44.98

伊藤の公式とか。有名すぎるか。

768

： １３２人目の素数さん [] 2011/12/15(木) 01:10:16.82

日本の統計学が、なぜ世界的に認められているのか？というと、
北川敏男の功績が大きいのだと思う。

769

： １３２人目の素数さん [] 2011/12/15(木) 21:49:09.89

分散って単なる副産物であって、その数値自体には使い道ないって解釈あってる？

770

： １３２人目の素数さん [sage] 2011/12/16(金) 00:11:41.54

比較以外にはないね。あと平方根をとって標準偏差にするか。

771

： １３２人目の素数さん [] 2011/12/16(金) 02:08:25.96

>>769

>>770

えええええーーーー！
おまいらアタマ大丈夫か？
視野が狭いというか、なんというか、、、

772

： １３２人目の素数さん [] 2011/12/16(金) 20:10:22.87

>>771

わからないから聞いているんだ。
教えてくれないか？

773

： １３２人目の素数さん [sage] 2011/12/16(金) 20:19:15.69

>>765

>>766

2009年夏に亡くなられた赤池情報量基準(AIC)で著名なこの方ですね。
訃報　元所長赤池弘次先生　平成21年8月4日逝去　享年81才
外部リンク

ttp://www.ism.ac.jp/news/2009/announce/index.html

774

： １３２人目の素数さん [] 2011/12/16(金) 22:32:49.86

>>772

ファイナンスや工学部ならすぐわかるはず
なんだよなあ。
どこの学部なんだろ？
まあ、統計学を使う仕事につけばわかるよ。
つけないだろうけど。

775

： １３２人目の素数さん [sage] 2011/12/17(土) 00:22:52.24

すぐ分かるんなら具体例を書いたらどうだ？
標準偏差でなく分散の大きさを直接使う例だぞ。
比較もしないからF検定もだめだぞ。

776

： １３２人目の素数さん [sage] 2011/12/17(土) 03:44:49.99

Hestonさんは確率変動分散をモデル化したけどね

777

： １３２人目の素数さん [sage] 2011/12/17(土) 09:24:54.41

おっさんって否定はするけど例は出せないっていうもが多いよね。

778

： １３２人目の素数さん [sage] 2011/12/17(土) 10:06:59.47

>>776

それも実際の確率微分方程式に組み込んでるのは標準偏差だよね。

779

： １３２人目の素数さん [sage] 2011/12/17(土) 10:40:43.79

いんや、varianceをもでるかしたのがヘストンモデル

780

： １３２人目の素数さん [sage] 2011/12/17(土) 12:00:47.41

価格の方じゃなく分散そのものに確率微分方程式を持ち込んでるのか。
まあでも相対的な変動を見ているんであって値そのものに
関心があるわけではないんだろうけどね。

781

： １３２人目の素数さん [sage] 2011/12/17(土) 17:22:32.34

高校数学からの橋渡しとして
西岡先生？の単位が取れる統計ノートって本が、良さげにみえるのですが。
実際、使ってる人読んだ事のある人、いらっしゃいますか？

782

： １３２人目の素数さん [] 2011/12/17(土) 17:32:28.55

高校数学からの橋渡しは、数学Bの統計と数学Cの確率と統計w
どうせ、受験科目として勉強してないだろ。

783

： １３２人目の素数さん [] 2011/12/17(土) 19:39:20.46

あのー、初心者なんですけど、
分散とかも比較にしかつかえないなら、
平均値も比較にしかつかえないですよね？
そういうこというと現実の数値は全て
比較にしかつかえないなーと思いました。

784

： １３２人目の素数さん [sage] 2011/12/17(土) 23:49:35.89

比較って相対的なものだよ。
平均値は目標値があったりとか絶対的な値に意味があるよ。

785

： １３２人目の素数さん [] 2011/12/18(日) 11:10:56.02

>>737

>きちんと抜き出すなら２０００人もやれば十分・・・・・・
母数の国民1億余人に対し、標本数2000人で十分というのは、許容誤差は何%でなのですか？
世上で、基準値500ベクレル超え福島県産出荷米発覚が問題になっていますが、これは
48市町村1174地点という出荷前標本調査の標本数が過少だったからだったのでは？
”４８市町村１１７４地点で放射性物質の抽出検査を実施。全地点で基準値を下回り、１０月１２日、
安全宣言して新米の流通を全面解禁・・・・・・”
外部リンク

ttp://www.kahoku.co.jp/spe/spe_sys1071/20111203_01.htm

786

： １３２人目の素数さん [sage] 2011/12/18(日) 12:30:17.22

分散をσ^2 と表したりs^2 と表したり見かけますが、どちらが一般的でしょうか？

787

： １３２人目の素数さん [sage] 2011/12/18(日) 14:36:54.84

>>786

西日本の大学の統計教科書では、それぞれσ^2は母分散、s^2は標本分散と書き分け
表わすとされていますね。μが母平均、xバーが標本平均と同様ですね。

788

： １３２人目の素数さん [sage] 2011/12/18(日) 15:20:12.34

ありがとうございました。よくわかりました。
もし、よろしければ、高校数学スレで確率変数の質問してますので。
そちらも…

789

： １３２人目の素数さん [sage] 2011/12/18(日) 15:55:13.62

>>785

＞ 48市町村1174地点という出荷前標本調査の標本数が過少だったからだったのでは？

48市町村1174地点というのは無作為抽出ではありません。
これで信頼性を高めるには、「多いところは意図的に外す」ができないくらい多く
かぎりなく全数調査に近いことをしなければ標本数は足りないでしょう

790

： １３２人目の素数さん [sage] 2011/12/18(日) 16:26:16.19

>>785

母数が国民全部なら±2.5％あたりで十分な調査などいくらでもあると思うが
どのような調査を考えているのか？

791

： １３２人目の素数さん [sage] 2011/12/18(日) 17:00:20.33

>>787

東日本は違うのか？w

792

： １３２人目の素数さん [sage] 2011/12/18(日) 17:07:44.16

西日本という大学はあるが（短期大学だが）
東日本という大学はない（東日本のつく大学はある）

793

： １３２人目の素数さん [sage] 2011/12/18(日) 21:50:32.05

>>787

普通はそれが一般的な表記だろう。
U^2については本によって分かれるけどね。

794

： １３２人目の素数さん [sage] 2011/12/18(日) 21:54:57.36

>>769

分散を評価しないと良い結論は言えないよ。
大学学部程度だとあまりわからないかもですが。

795

： １３２人目の素数さん [] 2011/12/18(日) 22:14:46.99

そういう意味では、分散がわからないと
分布がわからないから、
確率計算がなにもできくなる。

796

： １３２人目の素数さん [sage] 2011/12/18(日) 22:32:58.43

多変量になるとさらに共分散、相関係数なんかも
重要になるのでね。
行列代数も詳しくないとだめですよ

797

： １３２人目の素数さん [sage] 2011/12/18(日) 22:52:29.37

>>756

数学特に線形代数もわかんないで
数理統計なんかできないわ。
理論をちゃんとやらないで利用だけするなら
そうすればいいけどそれだったらテレビやネットの
いいかげんな世論調査とかアンケートの結果と変わんないでしょ。

798

： １３２人目の素数さん [sage] 2011/12/18(日) 23:24:40.23

世論調査がいいかげんとは。

本気で言っているのか。

799

： １３２人目の素数さん [sage] 2011/12/19(月) 00:28:43.35

>>794

話がずれている気がする。
相対的な評価はするでしょ。
数値自体ってそれを100にしたいとかそういうことではないのか？
ばらつきの制御自体は考えるけどその場合はやはり標準偏差だな。
共分散もそれを直接使う例があったら教えてほしい。
普通は相関係数にしてしまうよな。

800

：忍法帖【Lv=8,xxxP】 [sage] 2011/12/19(月) 00:42:39.41

葱

801

： 猫は馬鹿潰し ◆MuKUnGPXAY [age] 2011/12/19(月) 00:59:17.97

今ソレを煮てるワ。仕上がりは明日やけんどナ。

猫

802

： 猫はぱァ～ ◆MuKUnGPXAY [age] 2011/12/19(月) 01:50:47.03

今夜の調理はもうシマイや。そやしそろそろ寝るとスルかね。

猫

803

： １３２人目の素数さん [sage] 2011/12/19(月) 09:47:09.11

統計の分散がs^2 で確率変数の分散がσ^2 でない？

804

： １３２人目の素数さん [sage] 2011/12/19(月) 10:03:58.59

>>803

母分散,標本分散の定義見てみればわかるでしょ？

805

： １３２人目の素数さん [sage] 2011/12/20(火) 00:41:22.68

>>798

「いいかげんな世論調査」にそういう文句をつけるということは
「世論調査はすべて正しく厳密に行われている」よいう反論ということでよろしいか？

806

： １３２人目の素数さん [sage] 2011/12/20(火) 00:47:36.12

世論調査の標本のとり方、質問文、結果の処理に恣意性がはいる可能性はあるな

807

： １３２人目の素数さん [sage] 2011/12/20(火) 00:57:55.73

世論調査を厳密にするのは不可能だし、する必要もない。
かといって調査を捏造するほど、いいかげんなことはしていない。

バラツキはあるが、各社どこも似たような結果なのが証左。

808

： 806 [sage] 2011/12/20(火) 01:01:33.94

>バラツキはあるが、各社どこも似たような結果なのが証左。
違うだろ、新聞の色が出ているだろ。

809

： １３２人目の素数さん [sage] 2011/12/20(火) 01:36:07.20

テレビとかはよく、
ランダム・デジット・サンプリング、層化二段無作為抽出法
なんかを使ってるけど回収率とかも見てもどれほどいい結果かは
言いにくいでしょ。
やってるところがどんな結果がほしいかで誘導することも多いだろうし。

810

： １３２人目の素数さん [sage] 2011/12/20(火) 09:10:05.88

>>807

＞調査を捏造するほど、いいかげんなことはしていない。

どうしてそう信じられるの？

811

： １３２人目の素数さん [sage] 2011/12/20(火) 09:31:31.03

以前ある会社に勤務してた時、顧客からボーナス等の金額のアンケート取ってその調査結果を新聞発表してた
でもそのアンケートのほとんど社員がねつ造したものだった
実話です

812

： １３２人目の素数さん [sage] 2011/12/20(火) 10:47:27.42

>>811

とは別人だけど
大手の企業がアンケートを取る時には、関連会社経由でとることが多い。

で、たいがいは関連会社は自社に登録している客の情報を利用してアンケートを実施する。

なので、金融機関系のシンクタンクだと、サンプルが偏っていることが多い。

まあ、その会社の商品開発ならいいんだけど、それを一般的な調査結果のように公表することも多い。

813

： １３２人目の素数さん [sage] 2011/12/20(火) 13:33:30.20

>>810

選挙があるから。少しは新聞読んだら？

814

： １３２人目の素数さん [sage] 2011/12/20(火) 13:57:09.08

>>813

選挙があることが
世論調査は厳密に進められることはしないと
信じられる理由になるのか？
それが新聞に書いてあるのか？

815

： １３２人目の素数さん [sage] 2011/12/20(火) 13:58:26.29

× 世論調査は厳密に進められることはしないと

○ 世論調査は厳密に進められると

816

： １３２人目の素数さん [sage] 2011/12/20(火) 14:00:04.19

こうじゃね？

選挙があることが
世論調査は捏造なしに進められると
信じられる理由になるのか？
それが新聞に書いてあるのか？

817

： １３２人目の素数さん [sage] 2011/12/20(火) 14:00:28.30

だな

818

： １３２人目の素数さん [sage] 2011/12/20(火) 15:48:48.85

>>814

信じられる理由になるわけないだろ。
ちゃんと新聞各社ばらつきあるだろ。だから厳密ではないと言い切れる。
しかし、各社の推移を見ると、相関性が高く、選挙結果との相関性も高い。

だから、厳密ではないが、いいかげんでもない。統計学的に明らかだと思うが。

819

： １３２人目の素数さん [sage] 2011/12/20(火) 16:02:28.19

＞＞統計学的に明らかだと思うが。
もう少し統計学的な発言ができませんでしょうか？

820

： １３２人目の素数さん [sage] 2011/12/20(火) 16:09:57.25

>>819

分散と相関係数ぐらい自分で計算しろよw 初心者すぎだぞ>

821

： １３２人目の素数さん [sage] 2011/12/20(火) 16:20:28.03

>>818

それが信じられる理由でないなら、
世論調査がいいかげんではないと
信じられる理由は何なんだ？

極端な話をすれば、前日の他誌の発表を元に自社の捏造分を混ぜて
今日の原稿を書いたら、相関性が高く、選挙結果との相関性も高いものに
なるぞ。

822

： １３２人目の素数さん [sage] 2011/12/20(火) 16:32:36.19

>>820

おまえ、相関と分散くらいしか知らないんだろ
だから

>>818

のようなアフォなことが書ける

823

： １３２人目の素数さん [] 2011/12/20(火) 16:40:53.46

>>822

なら各社新聞社の世論調査がいいかげんなことを、統計学的な分析と結果をお願いします。
しかも、相関、分散以外の高度な統計とやらで。

824

： １３２人目の素数さん [sage] 2011/12/20(火) 16:43:03.15

お、話を逸らしたな

825

： １３２人目の素数さん [sage] 2011/12/20(火) 16:50:12.32

例えばフェルミ推計も併せてでも推論するならともかく

>>818

レベルじゃなw
どの社も通常サンプル数も公表してるんだから信頼水準を適当に設定して
各社間の差を比較評価するとか書けば尤もらしい意見になると思うんだがな
どうだい

>>823

826

： １３２人目の素数さん [] 2011/12/20(火) 17:00:22.55

>>825

分析結果まだ～？
なんで各社の世論調査はいいかげんだと証明しないの～？

まさか計算方法しりませんとかないよね？

827

： １３２人目の素数さん [sage] 2011/12/20(火) 17:17:55.61

>>825

言ってる意味が分からない。
いいかげんさを証明するのに、フェルミ推定というさらにいいかげんなものを推論して何がしたい？

828

： １３２人目の素数さん [sage] 2011/12/20(火) 17:24:08.25

>>822

随分と時間がかかるな。さっさと分析結果張れよ。
まさか逃げ出したんじゃないだろうね。最低のゴミくずだな、おまえ。

829

： １３２人目の素数さん [sage] 2011/12/20(火) 17:27:37.77

>>826

いい加減かもしれないし正しいかもしれないんだが
おまえは正しいと主張している
酔って証明をすべきなのはおまえな

830

： １３２人目の素数さん [sage] 2011/12/20(火) 17:29:08.49

>>827

薄い根拠で「新聞社は正しい」と主張するよりは”遥かに”ましになるだろ
それもわからんか？

831

： １３２人目の素数さん [sage] 2011/12/20(火) 17:29:27.24

>>828

>>829

832

： １３２人目の素数さん [sage] 2011/12/20(火) 17:30:48.69

>>829

おれは既に計算済みで結果のコピペ準備して、
おまえの回答待ってんだが。

833

： １３２人目の素数さん [sage] 2011/12/20(火) 17:38:51.02

>>830

分かるわけないだろ。おまえの妄想問題なんか。
勝手に問題変えるな。誰もそんなこと話してないだろ。頭おかしいのか？

新聞社は正しいではなく、
世論調査は厳密ではないが、いいかげんでもないってことだ。
ほんと馬鹿ほど妄想で勝手な解釈するから困る。

834

： １３２人目の素数さん [sage] 2011/12/20(火) 17:42:46.69

あれ？論点は捏造があるかどうかじゃっ？

835

： １３２人目の素数さん [sage] 2011/12/20(火) 17:46:55.91

世論調査が捏造ってネトウヨかよw

836

： １３２人目の素数さん [sage] 2011/12/20(火) 17:47:41.05

>>833

おい、論点すりかえるなよ

837

： １３２人目の素数さん [sage] 2011/12/20(火) 17:50:00.98

答えまだ～？

838

： 806 [sage] 2011/12/20(火) 18:09:42.03

>>798

1.世論調査が正しいことを検定する
2.世論調査が間違っていることを検定する
は違うだろ。言い出しっぺが1を統計的に実行してみせるのが筋じゃねー。

839

： １３２人目の素数さん [sage] 2011/12/20(火) 18:15:38.55

だな。言い出しっぺがまずは証明すべき。
世論調査をいいかげんと言ったのは　

>>797

840

： １３２人目の素数さん [sage] 2011/12/20(火) 18:30:42.65

各社世論調査比較。

ttp://blog-imgs-31-origin.fc2.com/2/c/h/2ch774/439-227.jpg

相関性が全くなく世論調査はいいかげんですね。とはとても言えませんね。

841

： １３２人目の素数さん [sage] 2011/12/20(火) 18:35:59.36

ソースが二種類あってそれをもとに各社がそれぞれ捏造した結果に見えるんだが

842

： １３２人目の素数さん [sage] 2011/12/20(火) 18:39:00.35

字が読めないんですね。分かります。
統計学学んでるなら、このグラフを見ただけで何のグラフか分かるはず。

843

： １３２人目の素数さん [sage] 2011/12/20(火) 18:50:39.32

>>822

さっさと分析しろよ。

おまえはどんだけアフォなんだよ？w

844

： １３２人目の素数さん [] 2011/12/20(火) 18:57:34.51

世論調査はいいかげんで捏造なのに、
なんで思想、哲学の違う各社に相関性が高かったり、分散が小さかったりするんですかね？

しかも大阪地方選のときも投票開始0分でズバリ的中。
本当に捏造でいいかげんなのでしょうか。

なぜ捏造でいいかげんなのか証明してほしいものです。
逃げてばかりのお馬鹿さんに言ってるのですよ。

845

： １３２人目の素数さん [sage] 2011/12/20(火) 19:18:31.49

>>840

順位の動きを見ると傾向があるので、統計的にはデータをいじってる可能性が高いって結果でしょ。

メンデルの遺伝の実験データがおかしいと、フィッシャーが指摘したのと同じかな。

846

： １３２人目の素数さん [sage] 2011/12/20(火) 19:29:00.08

>>845

調査方法、サンプル範囲が違うから当然そういう傾向が出る。
報道2001は首都圏のみとか。あるいは固定電話世帯のみとか。

というか早く世論調査はいいかげんで捏造したものという分析してくれよ。

ほんといつも逃げてばかりだな、おまえ。

847

： １３２人目の素数さん [sage] 2011/12/20(火) 19:31:57.17

まず捏造はないということを証明しろや
あの図が証明なのかw
恥ずかしい奴w

848

： １３２人目の素数さん [sage] 2011/12/20(火) 19:33:52.97

どうやって証明するんだ？w
フィッシャーだって証明できてないw

849

： １３２人目の素数さん [sage] 2011/12/20(火) 19:43:24.83

>>847

まずは捏造であることを証明しろ。捏造と言い出したのはおまえだ。

850

： １３２人目の素数さん [sage] 2011/12/20(火) 19:46:41.71

ぼくは捏造は無いとは言えないと主張しているだけ
証明の義務はない

851

： １３２人目の素数さん [sage] 2011/12/20(火) 19:56:49.04

>>841

>捏造した結果に見える
>捏造した結果に見える
>捏造した結果に見える

852

： １３２人目の素数さん [sage] 2011/12/20(火) 20:14:35.36

捏造かどうかなんて、
各社の世論調査にニコニコの調査もプロットすればすぐ分かるよ。

ネトウヨはいつもニコニコ以外の世論調査は捏造って言ってるからね。
本当なら有意な差が出るはず。

853

： １３２人目の素数さん [sage] 2011/12/20(火) 20:22:15.45

>>850

馬鹿かおまえは。

854

： １３２人目の素数さん [sage] 2011/12/20(火) 20:25:53.51

>>853

おまえよりはましだけどな

855

： １３２人目の素数さん [sage] 2011/12/20(火) 20:44:23.48

見つけたよ。確かに捏造疑惑があるな。

東京都都議選に関係する世論調査(どの政党の候補に投票しますか?)
　　　　　　　　　自民　　　民主　　ｻﾝﾌﾟﾙ数
毎日新聞　　　13%　　26%　　 1063
朝日新聞　　　15%　　28%　　 999
東京新聞　　　20.3%　32.5%　1529
ﾆｺﾆｺ動画　　　31.1%　11.8%　12507

NHK出口調査　26%　　44%

現実の都議選得票率 25.9%　　40.8%

856

： １３２人目の素数さん [sage] 2011/12/20(火) 21:19:57.44

実際の投票には行かない可能性があるので自民と民主の比率のみが正しいとすると
適合度検定で棄却されないのは東京新聞、朝日新聞の２つになるな。
毎日新聞は棄却されるがp値0.022で、ニコニコ新聞はほぼ０。
ニコニコ動画は、東京都の選挙権を持たない人がいるからだろう。

857

： １３２人目の素数さん [sage] 2011/12/20(火) 21:24:09.88

ニコニコ新聞ってｗ　自分でワロタ

858

： １３２人目の素数さん [sage] 2011/12/20(火) 21:46:48.05

>>855

ニコ動見てる人は関心ある人ばっかだから
偏ってしまうからなぁ。
まあ個人的には結果に納得するがw

859

： １３２人目の素数さん [sage] 2011/12/20(火) 23:15:52.58

>>797

～

>>858

世論調査はいい加減で捏造とか否捏造はないとか、理系学問板なのに主観評言の
横溢洪水ですね。
数学板らしく最適標本数算出式

>>761

の数理的な可否などを、論じませんか。

860

： １３２人目の素数さん [sage] 2011/12/20(火) 23:56:38.43

>>859

そうですねぇ
サンプルサイズ計算しないとだめね

861

： １３２人目の素数さん [sage] 2011/12/21(水) 03:48:24.71

分散すら計算することから逃げる人たちです。
議論はできないでしょう。

862

： １３２人目の素数さん [sage] 2011/12/21(水) 08:24:40.93

>>859

おいおい、検定は主観じゃないだろ。

>>860

サンプルサイズぐらい誰でも計算できるだろ。
支持率20%を信頼幅2%で予測するための人数は1536。
この人数で支持率が10%だと信頼幅約1.5%。
各新聞社の調査は人数だけなら十分とれているよ。

863

： １３２人目の素数さん [sage] 2011/12/21(水) 08:28:48.63

おっとこれも書いとかないと文句出るんだろうな。

>>855

の2社は約1000人の調査だけど信頼幅は支持率20%で2.5%を目指したんだろうね。
自民と民主で支持に差があることはこれで十分にわかる。

864

： １３２人目の素数さん [sage] 2011/12/21(水) 08:41:10.77

信頼幅2%？
なにそれ？

865

： １３２人目の素数さん [sage] 2011/12/21(水) 15:55:48.76

N＝30 α＝0.05 のときの(片側検定)Z値とt値てどうやってもとめるんですか?
誰かやり方だけでいいので教えてください

866

： １３２人目の素数さん [sage] 2011/12/21(水) 18:48:49.45

>>823

いい加減だという証明がないことが
いい加減な世論調は存在しないという証拠になるのだ
という主張ということでよろしいか？

867

： １３２人目の素数さん [sage] 2011/12/21(水) 18:51:55.07

>>839

797は「（すべての）世論調査がいい加減」と言っているのではなく
「いい加減（形容されるある）世論調査」についての話をしているのだが

868

： １３２人目の素数さん [sage] 2011/12/21(水) 20:40:05.89

>>840

　をみて
いいかげんだから世論調査は信用できないというほうが稀だろう。

この程度のバラツキでいいかげんだから許せない人ってここにいるの？

869

： １３２人目の素数さん [sage] 2011/12/21(水) 20:53:43.77

論点がずれてる
も少し上からきちんと読め

870

： １３２人目の素数さん [sage] 2011/12/21(水) 22:21:44.85

>>864

信頼区間の幅が±2%ってことだろ。

871

： １３２人目の素数さん [sage] 2011/12/22(木) 00:25:38.82

>>865

それだけの情報だと何がしたいか伝わらんよ
片側検定って言ったっていろいろあるんだよ

872

： １３２人目の素数さん [sage] 2011/12/22(木) 01:28:14.22

>>868

なぜ、「いいかげんな世論調査」の話題に
「すべての世論調査はいい加減で信用出来ないというのはおかしい」と乗っかってくるんだ？
必要条件と十分条件の違いとか、∃と∀の違いとかわかってるか？

873

： １３２人目の素数さん [sage] 2011/12/22(木) 02:02:28.34

一人で勝手に話題を限定したがる人がいるな。

874

： １３２人目の素数さん [sage] 2011/12/23(金) 02:25:18.71

とりあえず他人の言葉を否定したくてしょうがない人がいると話がややこしくなる

875

： １３２人目の素数さん [sage] 2011/12/24(土) 13:25:04.72

>>870

信頼幅という用語を

>>864

氏同様初めて目にしたが、言われるように信頼区間の幅の
意味のようですね。
統計教科書本でも見た記憶がないが、信頼率、信頼度、信頼水準、信頼区間、
信頼上（下）限同様に、JIS規格の用語集には掲載されているのかな。

876

： １３２人目の素数さん [] 2011/12/25(日) 01:41:21.02

どこで聞けばいいのか分からないのでここで質問させてください。

正規分布のような分布なのだけど、偏っている分布で、数学的に美しいのはどういうものになるのでしょうか？

正規分布は

*
**
***
**********
***********
**********
***
**
*

こんなのですが、私が求めているのは

*
**
**********
***********
**********
***
***
**
**
*
*

こんな感じで偏った正規分布みたいな形です。よろしくお願いいたします。

877

： １３２人目の素数さん [sage] 2011/12/25(日) 02:42:02.58

>>876

範囲がどこからどこで考えているのかわからないですけど
そのような形ならば
カイ２乗分布か、F分布だと思いますよ

878

： １３２人目の素数さん [] 2011/12/25(日) 06:24:26.30

>>876

そういう分布はありません。

879

： １３２人目の素数さん [] 2011/12/25(日) 06:53:49.98

>>876

ポアッソン分布も有力候補に挙げられると思いますよ。

880

： １３２人目の素数さん [] 2011/12/25(日) 15:49:58.85

>>862

>支持率20%を信頼幅2%で予測するための人数は1536。
>この人数で支持率が10%だと信頼幅約1.5%・・・・・・・
これらの算出には、どういう算出式を使われたのですか？

881

： １３２人目の素数さん [] 2011/12/25(日) 19:06:57.47

さ

882

： １３２人目の素数さん [] 2011/12/25(日) 22:08:32.60

>>877

>>879

バカなことを書かないように。

883

： １３２人目の素数さん [sage] 2011/12/25(日) 23:26:39.70

>>882

では優秀なお方、お答えは？？

884

： １３２人目の素数さん [] 2011/12/25(日) 23:43:17.00

相関係数の検定ってどうやるんですか？

885

： １３２人目の素数さん [sage] 2011/12/26(月) 01:11:05.70

>>876

対数正規分布もある

886

： １３２人目の素数さん [sage] 2011/12/26(月) 10:26:06.73

>>875

信頼幅って言葉はあるみたいだけど信頼区間の幅というのが正しい定義みたいだよ。
だから

>>862

の最初は4%の間違いだね。

>>880

二項分布の正規近似による信頼区間で簡単に確認できたけど？

887

： １３２人目の素数さん [sage] 2011/12/26(月) 23:54:24.26

すみません
大学で統計学を学んでいるのですが
質問させてください

第２種の誤りを犯す確率を小さくする方法として
「有意水準を大きくする」
以外に何がありますか？

888

： １３２人目の素数さん [sage] 2011/12/27(火) 08:36:08.48

>>887

データのバラツキ（分散σ）を減らすことと、データの数(n)を増やすことによって第二種の過誤を少なくすることができます

外部リンク

ttp://staff.aist.go.jp/t.ihara/confidence.html

889

： １３２人目の素数さん [] 2011/12/27(火) 21:11:45.34

すみません。統計学を勉強し始めたばかりのものなのですが、
「標本の数と大きさ」の違いでいきなり躓いてしまいました。
これはとある問題なのですが、

Q、標準的な統計学の試験問題についてある母集団から
無作為に抽出した学生を対象として解かせてみたところ、得点は次のようになった。
22,27,36,38,40,46,51,58

Q1,この標本の数と大きさを答えよ

標本の数は８だと思うのですが、大きさについての求め方がわかりません。
どなたかご回答をお願いしますm(__)m

890

： １３２人目の素数さん [sage] 2011/12/27(火) 21:41:02.74

数は 1 で大きさは 8かな?

891

： １３２人目の素数さん [sage] 2011/12/27(火) 22:00:25.01

>>890

ご回答ありがとうございます。質問なのですがなぜ数が１なのですか？

１というのはどこから来たものなのでしょうか？

892

： １３２人目の素数さん [sage] 2011/12/27(火) 22:02:01.34

ベイズの入門的な本を読んでわからなくなりました。
1/5の確率で当たるカードを二人めくるゲームです。まず二人がそれぞれのカードを選びます。
一人目をめくります。ハズレでした。
次にもう一人がめくる番ですが、最初のカードがハズレだと確認したあとに、選んでいたカードと別なカードを選び変えてしまいました。
そのカードを開くと当たりだったのです。
ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。

うんなことあるかいな？

そうなると、くじを戻さないくじ引きならば、後で選ぶ方が確率が高くなるはずです。

どなたか説明いただけませんか？

893

： １３２人目の素数さん [sage] 2011/12/27(火) 22:08:56.47

>>891

こういう抽出（試行）をもういちどやれば、2になる。

894

： １３２人目の素数さん [sage] 2011/12/27(火) 22:19:54.71

>>893

　ご親切に解説していただき、ありがとうございましたm(__)m

895

： １３２人目の素数さん [sage] 2011/12/27(火) 22:37:05.98

>>892

オレもこういうの、苦手なんだが。まず 2枚ひいたところで、オレの当たり確率は
1/5, 相手も 1/5。山にあるのが 3/5（つまりオレの札が外れの確率は 4/5）。相手が
はずれを開いた段階で、オレの札の確率は依然として 1/5だが、山の 3枚のおのおの
は、4/5 * 1/3 = 4/15の確率に増える。1/5 < 4/15 だから、そっちに
くらがえしたほうが有利となる。

896

： １３２人目の素数さん [sage] 2011/12/27(火) 22:46:04.03

ありがとうございます。
凄く理解したけど納得いかないーw
因みに、これはベイズの話でもなく一般的な確率の考えでも同じでしょうか？

897

： １３２人目の素数さん [sage] 2011/12/27(火) 22:46:52.44

者ティホール問題の亜型だな

898

： cheese ◆pMONpHJxkARi [] 2011/12/27(火) 22:49:00.90

>>893

stage の数を標本の数と呼ぶのは初耳です。
標本の大きさも標本数も同じ意味ですよね。

899

： １３２人目の素数さん [sage] 2011/12/27(火) 22:52:12.24

>>898

呼びかたに、いろいろ流儀があるらしい。
外部リンク

ttp://blog.livedoor.jp/yahata127/archives/51615946.html

900

： cheese ◆pMONpHJxkARi [] 2011/12/27(火) 22:55:57.36

ちょっとぐぐってきました。

>>899

リンクありがとうございます。
標本の大きさが100（100個の標本）が3セットあるとき
標本の数は3セットあるということなんですね。
stageの数とは全然関係ありませんでした。（二段階抽出の話かと思ったので）

901

： １３２人目の素数さん [sage] 2011/12/27(火) 23:00:40.64

>>896

現実問題として、こうなるらしい。オレもいまだに納得いかん。

902

： １３２人目の素数さん [sage] 2011/12/27(火) 23:04:05.66

ありがとうございます。
納得いかないので、エクセルでシミュレーションしてみます。

903

： １３２人目の素数さん [sage] 2011/12/27(火) 23:06:36.87

くじを戻さないくじ引きとは関係ないみたいですね…

904

： １３２人目の素数さん [sage] 2011/12/27(火) 23:32:36.51

>>888

なるほど

ありがとうございます

905

： 892 [] 2011/12/27(火) 23:54:34.69

エクセルでこの問題をテストしようと思けど、、明日朝から帰省だったので。
また後日。。(確率スレの方が良かったかしら。)

でも、相手がハズレを引いた段階で山の3枚、「オレ」の1枚をそれぞれ対等に1/4になった、
と考えるのがまだ正常に思うけど。

と思ったら、先にカードを開く方が1/5で、後に開く方が1/4になるってのも。。

906

： １３２人目の素数さん [sage] 2011/12/28(水) 00:23:02.20

>>905

> 先にカードを開く方が1/5で、後に開く方が1/4になるってのも。
相手は単にカードを開くのじゃなくて、「オレのコントロールできない 4枚の
中から、外れカードを一枚持ち去った。結果、山に残ったカードの当たり
確率は濃縮された」と考えるみたいなんだな。

907

： 892 [] 2011/12/28(水) 00:33:35.57

>>906

ありがとう。うーむ。

>>897

さんの、モンティホールでぐぐってみたら説明があった。
「論」ではなくて「実証」されてるんですね。
こんな単純で面白いモデルが、高校確率で扱わなかったのはなぜだろう。

908

： １３２人目の素数さん [sage] 2011/12/28(水) 10:06:44.72

高校でベイズの定理は習わないだろ。

909

： １３２人目の素数さん [sage] 2011/12/28(水) 10:45:56.15

Bayesは難しいが今の主流だからなぁ

910

： １３２人目の素数さん [sage] 2011/12/28(水) 11:06:28.00

中畑が監督では厳しいだろうな

911

： １３２人目の素数さん [sage] 2011/12/28(水) 11:20:36.12

中畑じゃなくても厳しいだろ

912

： １３２人目の素数さん [sage] 2011/12/28(水) 12:24:06.27

>>886

>信頼幅って言葉はあるみたいだけど・・・・・・・
会社で、”JIS Z8101 統計－用語と記号”を見ましたが、”信頼幅”は載っていないですね。
正確には、信頼区間の幅というべきでしょうね。

913

： １３２人目の素数さん [sage] 2011/12/28(水) 13:25:31.30

>>903

くじを戻さないくじ引きと、相手がハズレと分かった上で、引くくじを変える行為に、違いを感じないんだが。

例えば、二人が5本のくじを引くとして、それぞれ心の中で、引くくじを決めていたとする。(特に引くくじを宣言するわけでない。)
一人目がハズレで、二人目が気が変わって最初に思っていたくじとは別なくじを引く。
この時に、二人目が当たる確率はもはや1/5ではないと？

914

： １３２人目の素数さん [sage] 2011/12/28(水) 13:41:26.92

>>909

ビルゲイツがほめたベイズの定理という本のカバーがあったなー

915

： １３２人目の素数さん [sage] 2011/12/28(水) 13:48:09.30

ん、くじ引きの時は前もって引くくじを決めていて、実際のくじを引く場面(二番手以降)では、それではないくじを引く事にすればいいんだな。
(?_?)

先行不利？
(?_?)

916

： １３２人目の素数さん [sage] 2011/12/28(水) 16:41:16.99

Bayes流が讃えられているってことは
マルコフ連鎖も素晴らしいってことだよね

917

： １３２人目の素数さん [sage] 2011/12/28(水) 22:14:29.21

手元に一つのサイコロがある時、このサイコロに偏りがあるかどうかを調べるため、
サイコロを10000回投げて１の目が何回でたかを数えることにする。

１，「このサイコロに偏りがない」というためには１の目の出る回数は
　　　何回から何回の間でなければならないか？

２，「このサイコロは１の目が出やすい」というためには１の目が出る回数は
　　何回以上でなければならないか？　なお、有意水準は５％とする。

大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。
よろしくおねがいします。

918

： １３２人目の素数さん [sage] 2011/12/28(水) 22:24:26.17

>>912

別にすべての統計用語がJISに載ってるとは限らないだろ。
クロス集計表とかも載ってないぞ。
まあマイナーな言葉は使わないのがよいというのは分かるが。

919

： １３２人目の素数さん [sage] 2011/12/28(水) 22:47:00.83

intervalを幅と訳せば信頼幅だな

920

： １３２人目の素数さん [] 2011/12/29(木) 08:59:42.27

>>880

>>862

>>855

標本数算出式は以下の式なのでしょうが、このような政党支持調査の場合、
このどちらの式を適用するのですか？
対象母集団を（１）有限、（２）無限のどちらと看做すのですか？
標本はいくつ集めたらよいか　
外部リンク

ttp://www.ceser.hyogo-u.ac.jp/naritas/spss/sample_size/sample_size.htm

921

： １３２人目の素数さん [] 2011/12/29(木) 10:59:57.92

>>917

１の目だけを議論しても、偏りが無いなんて断定出来まい

その問題（１）を出した先生はアホ

922

： １３２人目の素数さん [sage] 2011/12/29(木) 13:04:38.22

>>917

>>921

の言うのももっともだが、1の出る確率を 1/6として、

1ばかり出る 1回連続 0.167　2回連続 0.028　3回 0.005
1が出ない 1回目 0.833 17回目 0.045 26回目 0.009

923

： １３２人目の素数さん [sage] 2011/12/29(木) 13:07:06.78

>>892

> ベイズ理論によると、二人目の行動により当たる確率が高くなったそうですが。

ならないならない。
これはモンティホールとは根本的に違う。

924

： １３２人目の素数さん [sage] 2011/12/29(木) 13:16:00.82

>>917

> 大学の統計学の問題でわからなくなってしまいました。どなたかご教授ください。

とりあえず、どこまで分かって、どの辺りで分からなくなってるのか説明してくれ

それから10000回投げて１の目が10000回出たら、「このサイコロおかしいだろ」って言うと思うけど、
それを数学的に述べてみてくれ。

どの程度理解してるのか分からないと、説明のしようがない

925

： １３２人目の素数さん [sage] 2011/12/29(木) 13:20:55.11

>>923

何が違うか言ってミ？

926

： １３２人目の素数さん [sage] 2011/12/29(木) 13:35:44.74

>>925

> 何が違うか言ってミ？

ふつうのクジは１人目が当たる可能性がある。
モンティホールの司会者は100%ハズレを引く。

927

： １３２人目の素数さん [sage] 2011/12/29(木) 14:28:03.82

>>926

> モンティホールの司会者は100%ハズレを引く。

この例題の対戦相手も 100%はずれを引く運命のもとにあったのかもしれない。
あるいは、実はイカサマをやっていて、相手に勝たせたかったのかもしれない。
どれが当たりか知っていたと称するモンティも、この相手も、客観的事実は
単にはずれを引いたということだけ。

928

： １３２人目の素数さん [] 2011/12/29(木) 15:33:25.34

>926,927

統計学的には９２６が正しい。

「運命」とか「いかさま」をいいだすと、統計学の問題のほとんどが成り立たない。

とくに断らない限り、試行はｉ．ｉ．ｄ．とし、それを客観とする。

929

： １３２人目の素数さん [sage] 2011/12/29(木) 15:39:43.01

一回目でハズレた事象は、意図的だろうと意図的でなかろうと二人目にとっては変わらない。ってこと？

930

： １３２人目の素数さん [sage] 2011/12/29(木) 15:44:43.89

っていうか。
やっぱり、取り替えた方が確率高くなるの？

931

： １３２人目の素数さん [sage] 2011/12/29(木) 16:15:17.07

いかさまも運命もないというなら、別に札は替えなくていいんじゃない？

932

： １３２人目の素数さん [sage] 2011/12/29(木) 16:54:04.97

ありがとうございます。つまり確率は、1/5ですね。

933

： １３２人目の素数さん [sage] 2011/12/30(金) 01:38:27.35

期末の過去問で分からない箇所があるので、解き方を含めて教えてください

問:27人分のデータを得て、2変数間の相関係数を計算した。次の①～⑤の相関係数のうち、有意水準が.05のときに仮説採択と言う結論になるものを全て選べ。

①.28
②.35
③.38
④.44
⑤.50

934

： 933 [sage] 2011/12/30(金) 01:40:15.30

表を貼り忘れました

ttp://i.imgur.com/4w2wv.jpg

935

： １３２人目の素数さん [] 2011/12/30(金) 03:27:06.59

>>934

その表ってのは、リンクが切れているみたいですが。。。

936

： １３２人目の素数さん [sage] 2011/12/30(金) 11:52:59.54

科学雑誌Newtonによると、太陽の直径は約１４０万キロメートルであり、
秒速約３０万キロメートルの光は５秒弱で通過できる計算になります。

しかし、太陽の中で生じた光（光子）は他の素粒子と衝突を繰り返し、
太陽の表面に達するまで平均で５，０００年もかかるそうです。

【問題】

太陽の中で生じた光で太陽の表面に達するまで１０，０００年以上かかるものは、
太陽の中で生じた光のうち何％でしょうか？

937

： 933 [sage] 2011/12/30(金) 12:01:05.84

>>935

すみません
IEブラウザで開いて頂ければ大丈夫だと思うのですが、念のためもう1度貼ります

外部リンク

ttp://www.dotup.org/uploda/www.dotup.org2447139.jpg

938

： １３２人目の素数さん [sage] 2011/12/30(金) 15:34:30.53

>>920

実際EXCELとかで計算するとすぐに分かるだろ。

>>862

で示されてた結果はそのページの無限の式で
最大誤差（信頼区間の幅の半分）=0.02
信頼率に対応する正規分布点=1.96
予想される母集団の比率=0.2
とすると得られるぞ。有権者の数はすごく多いから
有限の式は要らないんじゃないかな。

そのページでは最大誤差は0.05とすることが多いって書いてあるけど
それだとp=0.5でも384人で十分になる。
新聞社はさすがにそれよりかは多く調べてるってことだね。
1000人ぐらい調べてるってことは逆算すると最大誤差0.03という
あたりの設定かな。
結局どのぐらいの差まで見たいかに依存するので後は問題ごとに
考えるしかないよ。

939

： １３２人目の素数さん [sage] 2011/12/30(金) 20:09:27.15

>>936

スレ違いじゃない？w

940

： １３２人目の素数さん [sage] 2011/12/30(金) 21:22:46.96

>>939

解けない？

941

： １３２人目の素数さん [sage] 2011/12/30(金) 22:24:05.50

>>940

統計学とどう関係あるか詳しく述べよ

942

： １３２人目の素数さん [sage] 2011/12/30(金) 23:06:13.63

>>941

平均５，０００年→一定確率とみなせる。

goo辞書　【統計学】
確率論を基盤にして、集団全体の性質を一部の標本を調べることによって推定するための処理・分析方法について研究する学問。

統計学と関係さえあればどう関係あるかは問わないはず、ここは「なんでも」スレだから。スレチじゃないと思う。
言ってること間違ってるかな？

ところで、解けない？

943

： １３２人目の素数さん [] 2011/12/31(土) 00:46:41.85

ランダムウォークは統計力学で統計学じゃないし、進行距離分布の半径依存性も分からず解けるわけないし、数値もでたらめだから釣りとしか思わん。

944

： １３２人目の素数さん [sage] 2011/12/31(土) 01:01:00.07

>>943

数値はでたらめのつもりはないし問題を前提にしてもらえればいいと思う。
釣りのつもりはない。
統計学に関係あるかと思うけどスレチになるのかな？

解けるわけないし→回答と解してよい？

945

： １３２人目の素数さん [sage] 2011/12/31(土) 09:51:01.87

3次元ランダムウォークなら半径依存性はないと仮定していることになるな。
ただ３次元ランダムウォークって簡単に確率評価できたっけ？
シミュレーションならなんらかの解は出せそうかな。

946

： １３２人目の素数さん [sage] 2011/12/31(土) 10:49:38.73

>>933

お願いします

947

： １３２人目の素数さん [sage] 2011/12/31(土) 13:29:36.89

そこで、ベイズの登場なのら。

948

： １３２人目の素数さん [sage] 2011/12/31(土) 13:32:23.25

>>946

アンカーうざい。

949

： １３２人目の素数さん [sage] 2012/01/01(日) 23:00:41.97

質問いいですか？
平均の表現としてxの上にバー(ー)
を書く書き方あるけど2chでは
とう表現してるの？
標本平均です。

950

： １３２人目の素数さん [sage] 2012/01/02(月) 01:28:49.67

>>949

2chの流儀は知らんが、
¥bar{x}でいいんちゃうん

951

： １３２人目の素数さん [sage] 2012/01/02(月) 10:13:59.91

>>950

TeX用の表記か(笑)

952

： １３２人目の素数さん [sage] 2012/01/02(月) 18:42:24.99

>>933

誰も分からないのか答えないのか

953

： １３２人目の素数さん [sage] 2012/01/02(月) 21:08:14.87

>>951

そうです。.txt用です。

>>950

のアイデアならば
E(ber(X))、V(ber(X))となる
けどおk？

954

： １３２人目の素数さん [sage] 2012/01/02(月) 21:12:12.69

>>953

tex != txt
bar != ber

外部リンク

ttp://en.wikipedia.org/wiki/LaTeX

955

： １３２人目の素数さん [sage] 2012/01/02(月) 21:33:27.30

>>952

面倒なのでリンク先を見てない。

956

： １３２人目の素数さん [sage] 2012/01/02(月) 22:10:01.70

>>954

訳がわからないよ

957

： １３２人目の素数さん [sage] 2012/01/03(火) 01:31:02.27

標本平均:
\bar{X} = \frac{1}{n} \sum_{i=1}^{n} X_{i}

標本分散:
S^2 = \frac{1}{n} \sum_{i=1}^{n} (X_{i}-\bar{X})^2

958

： 936 [sage] 2012/01/03(火) 22:07:16.14

回答がないので出題を終了します。
ありがとうございました。

959

： １３２人目の素数さん [sage] 2012/01/03(火) 22:09:41.91

あー、せっかく回答を考えたのに締切かー

960

： １３２人目の素数さん [sage] 2012/01/04(水) 00:05:47.91

じゃあ言ってみて

961

： １３２人目の素数さん [sage] 2012/01/04(水) 00:06:56.04

ちょっと変わった不思議なコインがあるとします。
このコイン10,000回投げてみると、大体半数づつ表と裏が出ているのですが、なぜか、表と裏が連続してでる事が極端に多いのです。
例えば、表100回連続でたあと、裏が200回でます。
でも10000回投げてみると大体半数ずつに収まっています。

このような、極端なブレを検定するには何と何を比べればよいでしょうか？

またもし、100回200回の連続ではなくて、10回20回の連続が出現するとして、それが通常の範囲なのか調べるには、何と何を比べればよいでしょうか？

統計は数学2レベルですが、難しい解答でも構いません。解らないところは自分で調べますので。

どうぞよろしくお願いします。

962

： １３２人目の素数さん [sage] 2012/01/04(水) 00:47:39.93

１００分の１で当たるくじがあったとすると１００００回やった時の標準偏差は√期待値で１０
なのはわかるんですが、
それぞれのあたりが1/2の確率でもう一回当たるとした時の標準偏差はどうやって計算したら良いですか？

963

： １３２人目の素数さん [sage] 2012/01/04(水) 01:05:02.85

>>961

「統計は数学2レベル」
この問題はそうかもしんないけど
本来の数理統計の理論はそんなレベル低くない

964

： １３２人目の素数さん [sage] 2012/01/04(水) 01:06:08.86

>>962

標準偏差は、分散の平方根だよ

965

： １３２人目の素数さん [sage] 2012/01/04(水) 01:17:42.23

失礼しました。
私の統計の知識が、数学ⅡBしかないという事です。

コインの問題は、自分が疑問に思っていることを、コインに置き換えているだけですので、普通の統計学の「問題」とは趣きが違うかもしれません。

966

： １３２人目の素数さん [sage] 2012/01/04(水) 01:27:35.01

ところでこの問題。
連続して事象が発生する回数を記録して相対度数のグラフを出して、それを普通のランダムなコインの相対度数のグラフと比べる事で、検定できそうですが、いかがでしょうか？

967

： １３２人目の素数さん [sage] 2012/01/04(水) 02:53:17.71

>>964

分散はどうやって求めるのでしょうか？

968

： １３２人目の素数さん [sage] 2012/01/04(水) 03:19:10.13

分散は各確率変数の二乗と、各確率を掛け合わせた和から、期待値の二乗を引いたもの。

969

： １３２人目の素数さん [sage] 2012/01/04(水) 03:26:28.54

962の場合は二項分布になるから。
繰り返しの回数 × 確率 ×(1-確率)

でも分散の値は求められる。かも。

970

： １３２人目の素数さん [sage] 2012/01/04(水) 03:29:45.20

あいや、962は二項分布じゃなかったゎ。
上のは無し。

971

： １３２人目の素数さん [sage] 2012/01/04(水) 08:35:13.01

>>967

Var(X)=E(X-E(X))^2
SD=√Var(X)

972

： １３２人目の素数さん [] 2012/01/05(木) 12:03:39.38

統計の分野の最新の論文はどこのサイトで見れるんでしょうか？
やはりarxivでしょうか？

973

： １３２人目の素数さん [sage] 2012/01/05(木) 14:33:42.44

>>972

図書館に行って司書さんに相談しろ。

974

： １３２人目の素数さん [] 2012/01/06(金) 01:04:59.06

>>972

どういう方面の論文を探すかわかってなければ、
なかなか答えようがありません。

975

： １３２人目の素数さん [sage] 2012/01/06(金) 01:06:59.04

>>972

here you are
外部リンク

ttp://www.statsci.org/jourlist.html

976

： １３２人目の素数さん [sage] 2012/01/06(金) 09:47:41.31

>>961

＞極端なブレを検定するには

何を検定したいんだ？

977

： １３２人目の素数さん [sage] 2012/01/06(金) 10:00:45.03

>>961

コインを投げるときに、「表裏」ではなく、直前回と同じ側が出たかどうか「同異」を調べれば
出目の独立した偏りのないコインでは、「同異」の両者はほぼ同数になるはずだ。

その不思議なコインの「同異」が50%であると仮定して、そのコインを投げた結果を
検定をしてみるといい。

978

： １３２人目の素数さん [sage] 2012/01/06(金) 23:41:45.24

>>977

さん。

>>976

さん。取り上げていただいて、ありがとうございます。
そうです。
裏表ではなくて、直前の現象と同じであるかを調べたいのです。
同異というのですかね。参考にさせていただけます。

すいません。もうひとつ質問します。
1/2になる確率の通常の事象について、その事象を繰り返していきますと、同異の分布は均しくなっていきますでしょうか？
上手く言えないなぁ。

つまり、10円だろうと、500円だろうと、エクセルでランダムに1/2を発生させただろうと、もし偏りがなければ、前の事象と同じ事象が連続して現れる確率は均しくなるでしょうか？
もし、これを分布としてグラフ(横軸：連続回数。縦軸：発生数)を描くと、滑り台のような、右下がりの分布図になると思いますがいかがでしょうか？

979

： 978 [] 2012/01/07(土) 02:11:52.64

自己解決しました。よく考えたら。

1/2の確率の事象ならば、前回と同じものが出る確率も1/2ですね。
ですので、10円でも500円でも、エクセルでも1/2の事象なら、
前回と同じものが出る確率は1/2になるのは1/2ですね。当たり前か。

自分が質問したのは、コイン投げで、もし前回と同じ事象がでる事象が続いたとき
それは、大きくぶれながらそのうち、1/2に収束していくのか。
それとも、1/2に添うように小刻みに修正？しながら、1/2に収束していくのか。
ちょっと謎だったのです。

分布グラフについても、
試行を続けると、「同異」する可能性は1/2づつ減って行きますので。
理論的には右下がりで、下の指数グラフのような（但しY=1を通らない）グラフになるかな
と思いました。

試行100回で1/2の確率で前回と同じ事象を示すグラフなら、理論的に
下のような座標に添う分布になるかと思います。（どうだろう。）
X軸：連続回数
Y軸：連続回数の発生数
例えば、3回つづけて同じ事象が続く事象は25回/100回
（2,50）
（3,25）
（4,12.5）
（5,6.25）
（6,3.125）
（7,1.5625）

いろいろ勉強になりました。ありがとうございました。

980

： １３２人目の素数さん [sage] 2012/01/07(土) 06:03:08.88

>>938

>無限の式で
>最大誤差（信頼区間の幅の半分）=0.02
>信頼率に対応する正規分布点=1.96
>予想される母集団の比率=0.2 ・・・・・・・
応答有難うございます。最大誤差=0.02 とは、=±0.02 の意ですね。

981

： １３２人目の素数さん [sage] 2012/01/10(火) 02:13:41.41

>>979

> それは、大きくぶれながらそのうち、1/2に収束していくのか。
> それとも、1/2に添うように小刻みに修正？しながら、1/2に収束していくのか。

もしかして、よくある誤解をしているのかもしれないので、ひとこと添えておく

理想的なコインを投げたところ、「たまたま」表ばかりが２０回とか１００回とか
続けて出てしまうことがあるかもしれない。（そういう可能性は０ではない。）
しかしもしそういうことが起こってたとしも、十分多くの回数コインを投げ続けると
表裏は1/2に収束して行く。

ただし、この収束では、先にでた１００回の表を埋め合わせるように裏が１００回分多く出る
というような意味のことではない。

１０１回目以降もコインは変わらず1/2で表裏が出続ける。
先に言った「十分多くの回数」とは、最初に出た１００回なんて誤差のうちにしかならないくらい
多くの十分な回数という意味なんである。

982

： １３２人目の素数さん [] 2012/01/10(火) 02:33:02.45

大学の実験で、正規分布に従うとされるデータを200個取ったのですが、
データ整理の項目で、標準偏差と平均の平方根を比較せよ、というものがあります。

この2つの値を比較する意図が分からないのですが、何が分かるのでしょうか。

983

： １３２人目の素数さん [] 2012/01/10(火) 03:50:06.94

>>982

もっと詳しく説明してもらわないとわかりません。
例えば、標本サイズが２００で標本は１個なの？

984

： １３２人目の素数さん [] 2012/01/10(火) 04:58:45.33

>>983

標本サイズ200、標本数1です。
放射線学の実験のデータ処理なので統計学に深く突っ込んだ話ではないと思います。

平均値と標準偏差は同じ次元のデータなので、
どうして平均値に√をつけたものと、標準偏差の値を比較するのかが分からないのです。
得られたデータについて何の評価もできない気がするのですが。

985

： １３２人目の素数さん [sage] 2012/01/10(火) 09:03:17.87

それ分からんとはあまりに勉強不足じゃね？

986

： １３２人目の素数さん [sage] 2012/01/10(火) 09:46:17.22

>>982

平均・分散・標準偏差の定義をよく見て考えてみ

987

： 984 [] 2012/01/10(火) 10:23:13.26

数時間ガチで考えて分からないんですけど、
標準偏差と√(平均)の比較っていうのは、
分散と平均の比較とほぼ同義ですよね。

そもそも、分散だと元のデータと直接比較ができないから、標準偏差の概念があるんじゃないんですか？

それぞれの定義も考えたんですけど、どう変形しても結局2乗と1乗の比較になっちゃうから比べられないです。

988

： １３２人目の素数さん [sage] 2012/01/10(火) 10:24:31.91

>>981

　Diceうのホウソク？

989

： １３２人目の素数さん [sage] 2012/01/10(火) 11:29:11.68

>>982

「元の分布の標準偏差」と「データ偏差の2乗平均の平方根」だろ。

990

： １３２人目の素数さん [sage] 2012/01/10(火) 21:41:16.24

>>982

ポアソン分布について調べてみたら。