統計学Part１５

： １３２人目の素数さん [] 2013/04/05(金) 23:35:41.08

前スレ

統計学なんでもスレッド14
ttp://uni.2ch.net/test/read.cgi/math/1326471964/

： １３２人目の素数さん [age] 2013/04/06(土) 15:57:12.57

おまんこ女学院

： あぼーん [あぼーん]

あぼーん

： あぼーん [あぼーん]

あぼーん

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [] 2013/04/11(木) 14:10:30.81

誰か書き込んでー

： １３２人目の素数さん [] 2013/04/11(木) 16:01:15.32

7匹でもハチ

： １３２人目の素数さん [sage] 2013/04/11(木) 16:09:48.89

実データ集計にヒストグラムなんぞ使うのは間違ってる
確率は累積分布関数が基本なんだから累積ヒストグラムを使うべきだ
ビン幅に依存しない最大限に正確な分析が出来る

： １３２人目の素数さん [] 2013/04/12(金) 14:46:43.79

こちらの方々って、『N=95を統計処理』って言われただけで意味分かりますか？
ライザップってジムのバナー広告で、

めざせ-15kg！ ※2
※2 N=95を統計処理した結果(2013年2月LM研究財団調べ)

ってのがあるのですが、何を言っているのかが分かりません。
その財団のサイトを探しても見つかりません。

： １３２人目の素数さん [sage] 2013/04/12(金) 15:31:00.18

効果があったと言ってる人が95人いるってことだろ

： １３２人目の素数さん [sage] 2013/04/12(金) 15:57:52.72

100%が痩せています※
※N=95を統計処理した結果(2013年LM研究財団調べ)　統計的な確立の表現であり、特異な例外はありえます。

統計「的」、あくまでも確立であって確率ではないところがポイントｗ

： １３２人目の素数さん [] 2013/04/12(金) 18:25:20.61

>>10

そうしますと、
・母体数：95人
・95人が落とした体重の平均値：15kg
ってことでしょうか？
そんな簡単な計算を財団に依頼したとか言ってるんですか？

： １３２人目の素数さん [] 2013/04/12(金) 23:56:37.28

仕事でクラメールのVを使うことになったのですが、クラメールのVが0以上1以下という証明が掲載されている本はないでしょうか？
検索したり自分で考えたりしてみたのですがわかりませんでした。

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [sage] 2013/04/13(土) 11:33:02.13

>>12

言うのは勝手

： １３２人目の素数さん [] 2013/04/18(木) 11:34:20.17

ガチでわからなくて困ってるんだけど教えてください
30分に平均1台の車が通る高速道路で、ある車が通過してから、（その車を含めて）5台目の車が通るまでの時間をXとする。
Xの平均と分散を求めよ。
まず何の分布（ポアソン分布だとか幾何分布だとか）なのかもよくわからなくて詰んでる。

： １３２人目の素数さん [sage] 2013/04/18(木) 16:53:59.73

車と車の時間間隔は指数分布でそれが4つの和の分布は4つ畳込みだ
ポアソン分布は一定時間に通る車の数

： １３２人目の素数さん [] 2013/04/19(金) 14:21:41.47

>>17

ってことは
平均で一時間に二台車が通るということだから
四台とおるのにx時間かかるとして、その確率は
f(x)=Γ(4,2)=(8/3)x^3*e^(-2x) (0<x<∞)
よって
E(x)=∮[0:∞]x*f(x) dx
=(1/12)*Γ(5)=(1/12)*4!=2(時間)
また、
V(x)=E(x^2)-(E(x))^2
=∮[0:∞]x^2*f(x) dx-2^2=(1/24)Γ(6)-4=(1/24)*5!-4=5-4=1
ということでよろしいですか？
確率難しすぎワロタ

： １３２人目の素数さん [sage] 2013/04/19(金) 21:16:24.01

なんで５台あたり通る分布が４つの畳み込み積分？
車が２台あたり１時間通る分布がλ＝２で
2*exp(-2*t)なのは解るけど、そこからどう導くんでしょうか。

： １３２人目の素数さん [] 2013/04/19(金) 21:56:57.16

TEST

： １３２人目の素数さん [sage] 2013/04/19(金) 22:09:52.94

>>1

スレ趣旨テンプレを省略するなよ。1000番間近で前スレは、何故にdat落ちしたのだろ？

以下のお約束を守った上で統計学について何でもどうぞ。
1)学校の宿題の丸投げはやめましょう。
2)質問者は質問の前に相当程度調べるなり、考えるなりしましょう。
3)荒らしは基本的にスルーでお願いします。

： １３２人目の素数さん [sage] 2013/04/19(金) 22:13:22.88

>>2

： １３２人目の素数さん [sage] 2013/04/19(金) 22:16:10.11

>>3

関連スレ１　ソフトウェア
【R言語】統計解析フリーソフトＲ第４章【GNU R】
ttp://kamome.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
ttp://kamome.2ch.net/test/read.cgi/math/1284083650/
統計・解析ソフトについて
ttp://hibari.2ch.net/test/read.cgi/bsoft/1012298063/
【統計分析】機械学習・データマイニング【集合知】
ttp://toro.2ch.net/test/read.cgi/tech/1286200810/

関連スレ２　試験
【会計士】★統計学part2★【選択科目】
ttp://kohada.2ch.net/test/read.cgi/exam/1260227046/
【通信】　　統計士・データ解析士　　【高杉】
ttp://ikura.2ch.net/test/read.cgi/lic/1288016000/
統計・プログラミング選択あつまれー
ttp://kohada.2ch.net/test/read.cgi/kouri/1323147411/
センター数学2Bで統計選択のやつ集まれ～ 2011
ttp://kohada.2ch.net/test/read.cgi/kouri/1318831930/

関連スレ３　その他
統計学は低脳のやる学問？
ttp://uni.2ch.net/test/read.cgi/math/1310989332/
心理統計学スレ
ttp://awabi.2ch.net/test/read.cgi/psycho/1324507670/
偏った標本調査・世論調査・統計を吊し上げるスレ
ttp://ikura.2ch.net/test/read.cgi/sim/1322885523/
【泰野くん】（独）統計センター２【藤田】
ttp://uni.2ch.net/test/read.cgi/koumu/1284048045/
【さよなら】（独）統計センター３【ラスプーチン】
ttp://uni.2ch.net/test/read.cgi/koumu/1285335261/

： １３２人目の素数さん [sage] 2013/04/19(金) 22:20:02.26

>>4

関連スレ４　kamome鯖霧散消失前スレ
【統計学】統計的仮説検定！！
ttp://science6.2ch.net/test/read.cgi/math/1201535084/
◆統計学について語るスレ
ttp://kamome.2ch.net/test/read.cgi/sim/1012828891/
生物学での統計学スレ
ttp://kamome.2ch.net/test/read.cgi/life/1127772845/
統計ソフト統合スレッド－SPSS・SAS以外
ttp://yasai.2ch.net/test/read.cgi/psycho/1012801769/
SASスレ
ttp://yasai.2ch.net/test/read.cgi/psycho/1012738237/
SPSSスレ
ttp://yasai.2ch.net/test/read.cgi/psycho/1012388599/

： １３２人目の素数さん [sage] 2013/04/19(金) 22:28:40.71

>>5

関連スレ５　数学板現役スレ
統計学の分かりやすい本教えろください
ttp://uni.2ch.net/test/read.cgi/math/1337166984/
【R言語】統計解析フリーソフトＲ第４章【GNU R】
ttp://uni.2ch.net/test/read.cgi/math/1294561909/
統計ソフトSTATAの部屋 Ver.2
ttp://uni.2ch.net/test/read.cgi/math/1284083650/

： １３２人目の素数さん [sage] 2013/04/19(金) 23:08:43.23

>>6

関連スレ４補　kamome鯖霧散消失前スレ
統計学なんて数学じゃないだろ
ttp://kamome.2ch.net/test/read.cgi/math/1173876727/
「今後一番セクシーな仕事は統計学者になるはずだ」
ttp://science6.2ch.net/test/read.cgi/math/1245375555/
統計学的手法の数々の競馬への転用の実証
ttp://science6.2ch.net/test/read.cgi/sim/1052761881/
統計学
ttp://kamome.2ch.net/test/read.cgi/sociology/982489314/
経済学で使う統計学スレッド
ttp://kamome.2ch.net/test/read.cgi/economics/1094012265/

： １３２人目の素数さん [sage] 2013/04/19(金) 23:16:16.49

>>896

>統計学の本なんて実践的な本しか見たこと無いけど・・・・・・
おいおい、これらの統計学初学者向けの名著を目にしたことはないのかね？
初等統計学（第４版）　Ｐ．Ｇ．ホーエル　培風館　A5判　1981/01　
外部リンク

ttp://www.washin.co.jp/honya/outline/4-563-00839-7.htm
はじめての統計学　鳥居泰彦　日本経済新聞社　Ａ5判　1994.11
外部リンク

ttp://www.nikkeibook.com/book_detail/13074/#9784532130749

： １３２人目の素数さん [sage] 2013/04/21(日) 13:46:36.11

前スレ質問を、再録です。
二項分布を正規分布で近似してるから>>

>>933

は、P(1-P)/n式の答でしょうが、
これがなぜ誤差分になるのかが知りたいのです。
932 ：１３２人目の素数さん[sage] ：投稿日：2013/03/18 21:48:52

>>924

ｎを導く統計学公式の元式
　　　　　μ<Xbar+1.96*SQRT(P(1-P)/n)
の右辺第2項即ち誤差項の成り立ちが、理解できません。
比率Pとその補数の積を標本数で割ったP(1-P)/nの平方根が、どうして誤差分に
なるのですか？

： １３２人目の素数さん [sage] 2013/04/21(日) 15:35:28.01

調べるのメンドイから調べないけどw
チェビシェフの不等式に何か代入して、崩したら信頼区間の形になった気がする。
あと最初は標準正規分布の信頼区間から考えた方がいいと思われ。
それができたあとに、二項分布に中心極限定理使えばあなたが示す式になるかと。

何言ってるのかわけわかめなら数理統計学の入門書読んだ方が早い気がするお。
あと自分の持ってる数理統計の知識とかも書いてくれた方がレスつきやすいんじゃないかな。

： １３２人目の素数さん [sage] 2013/04/21(日) 20:51:47.52

勉強もせずに問題やってるんだろ

：２８ [sage] 2013/04/23(火) 23:21:39.86

>>29

：２８ [sage] 2013/04/23(火) 23:52:33.71

>>29

助言有難うございます。当方は、統計学未修工学部卒の統計学習７年生です。
標準正規分布-->二項分布の２段階に分けて考えるわけですね。
　　正規分布変数Xの標準化式 u=(X-μ)/σ ・・・・32-１)
　　は理解できます。
　　95％信頼区間上限値u=1.96を32-１)式に代入して、正規分布時の

>>28

式右辺が、
　　導出されるのも理解できます。
理解できていないのが、

>>28

式の以下の２点です。
　　Q1.平方根に変わるのは、何故？
　　Q2.P(1-P)/nに、何故置換できるの？

： １３２人目の素数さん [sage] 2013/04/24(水) 15:54:02.00

正規分布の標準かはX~ Norm(μ,sigma^2)のとき(X-μ)/σ ~ Norm(0,1)であってるけど

中心極限定理は
X~何らかの分布（BinでもPoissonでもWeibullでも、、）
のときlim n-> ∞で (X_bar - μ)/(sigma/sqrt(n)) ~ Z(0,1)がなりたつというもの。
試しにX_i ~ Bin(1,p)を公式に代入してみて。期待値はp、分散はp*(1-p)なので簡単。

： １３２人目の素数さん [sage] 2013/04/24(水) 15:59:00.49

Z(0,1)じゃなくてNorm(0,1)ね。

それとサンプルの平均と分散を求めてみてください。
X_i ~iid~ BIn(1,p)としたとき
E[X] = p
Var[X] = p(1-p)ですが
E[X_bar]とVar[X_bar]はどうなるでしょうか。
ヒント：X_bar = (X_1 + X_2+ ,,,,+X_n)/n

： １３２人目の素数さん [sage] 2013/04/26(金) 21:50:25.31

来月5/13に故田口玄一一周忌記念統計学シンポが、筑波大であるようです。
田口玄一博士一周忌シンポジウム-統計科学から見たタグチメソッドの現在・過去・未来-
【日時】２０１３年５月１３日（月）９：３０～１７：１０
【場所】筑波大学東京キャンパス
【主催】統計数理研究所サービス科学研究センター　他
【定員】 150名
外部リンク

ttp://noe.ism.ac.jp/service-center/2013/02/24/

： １３２人目の素数さん [] 2013/05/02(木) 07:18:22.40

文系なんだが大学文理移転してで統計学極められるかな？

： １３２人目の素数さん [sage] 2013/05/02(木) 12:24:55.42

能力次第

： １３２人目の素数さん [sage] 2013/05/02(木) 20:31:33.94

>>36

ていうか、文系でも計量系はどっぷり統計学に漬かっているし、
その分野に固有の統計的問題に取り組んでいる。
文系理系は関係ないから、本人のやる気と能力次第。

： １３２人目の素数さん [sage] 2013/05/03(金) 09:42:25.95

>>37-38

ありがと
希望持てたはW

： １３２人目の素数さん [sage] 2013/05/05(日) 06:40:40.59

ベイズ統計学のおすすめの洋書ありましたら教えてくださいm（＿＿）m

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [] 2013/05/08(水) 14:56:13.69

仮説検定には帰無仮説と対立仮説がありますが、一般的にどちらの仮説がより重要なのでしょうか？

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [sage] 2013/05/08(水) 21:38:59.46

それ尋ねてる時点で、定義が解ってない。
教科書はいつ読むの？今日でしょ。

： １３２人目の素数さん [sage] 2013/05/09(木) 19:48:24.85

>>42

10円玉には裏と表がありますが、どちらがより10円なのでしょう？
と尋ねられたときと同じくらいインパクトのある質問だなw

： １３２人目の素数さん [sage] 2013/05/09(木) 20:24:39.46

裏に決まってるだろ

： １３２人目の素数さん [] 2013/05/09(木) 22:21:36.31

統計の分散分析ででてくる、
「対比」は、英語でなんと言いますか？

： １３２人目の素数さん [sage] 2013/05/09(木) 22:34:16.79

contarst

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [sage] 2013/05/11(土) 10:46:33.42

最近やっと簡単な統計学の教科書を一冊終えました。（有名な東京大学出版の赤と灰色が基調の本です）
そしてもう一段上の教科書に手を出してみたのですが。。。
測度論？が難しくて理解できませんでした。そこで測度論のための教科書を当たってみたのですが
これも数学記号が難しい。どなたか数学に詳しい人がいたらどの分野の順序で測度論を勉強すれば良いか教えてもらえると幸いです。

集合論→測度論
で良いんでしょうか。

： １３２人目の素数さん [sage] 2013/05/11(土) 11:03:19.97

微積分は知ってるのか？

： １３２人目の素数さん [sage] 2013/05/11(土) 11:31:23.51

微積分、線形代数、ベクトル解析、偏微分常微分はしってますが計算ができるくらいで。
εデルタ論法や写像などの数学科ぽい事は解りません。群環体とか現代数学ぽいのも
勉強した経験はないです。適当にググった所によると

Real and Complex Analysis Rudin
『はじめての確率論測度から確率へ』佐藤担
講座数学の考え方 (20) 確率論　船木直久
が良いみたいですね。

： １３２人目の素数さん [sage] 2013/05/11(土) 21:57:38.78

測度論はεδ論法を使いまくるぞ

： １３２人目の素数さん [sage] 2013/05/12(日) 01:06:29.12

マジですか。結局勉強す順番としては
集合論→解析学（？）→測度論
でいいのかな。

： １３２人目の素数さん [sage] 2013/05/12(日) 01:20:49.31

解析学を全部やると測度論を含んでしまうから
わからん言葉が出てきたら辞書みたいに調べる程度で良いが
εδ論法は良く理解する事

： １３２人目の素数さん [sage] 2013/05/13(月) 21:09:16.71

統計をまなび初めて日が浅いのです。よろしければ教えてください。
平均＝７０、標準偏差＝１０の正規分布に従った。このとき
・競争率が１０倍だったときの、合格最低点

という問題で、回答には正規分布表よりα（ｚ）＝０．４より、ｚ＝１．２９がわかるので～→合格最低点８３点と書いてあるのですが
０．４という数字や１．２９という数字が出てきた理由がわからないです。教えてください。

： １３２人目の素数さん [sage] 2013/05/13(月) 23:00:03.97

上位1割を合格とするときの最低点を求めよ

： １３２人目の素数さん [sage] 2013/05/14(火) 00:19:34.51

標準偏差でよくでるσについて質問ですがσ=68%、２σ=95%、3σ=99%をどう扱えばいいか分かりません。
例えば棒の長さのばらつきを調べたい場合、標準偏差を計算したらσが2.2とかになったらどういうことなんでしょうか。

： １３２人目の素数さん [sage] 2013/05/15(水) 03:44:18.20

仮に棒の長さの平均が5だとすると
棒の長さが5-2.2~5+2.2
つまり棒の長さが2.8~7.2にあるような棒の割合はおおよそ68%であるということ
また長さが5-2.2*2~5+2.2*2
つまり長さが0.6~9.4にあるのうな棒の割合はおおよそ95%であるということ

： １３２人目の素数さん [sage] 2013/05/18(土) 03:20:26.70

>>18

f(x)=Γ(4,2)なのは X~expo(1/2)のとき、X~Γ(1,2)で4X ~ Γ(4,2)だから
という理解であってる？

： １３２人目の素数さん [sage] 2013/05/21(火) 20:00:07.01

このニュース記事なのだが、同一大学・同一学部のデータを比較しないと意味がないと思う。

東大よ、その入試で大丈夫か
外部リンク

ttp://sankei.jp.msn.com/life/news/130520/edc13052011570000-n2.htm

ニュース内容は、推薦入試で入学すると所得が下がるという主張だが・・・。

学生数を確保するために推薦入試を多用する大学があり、
そういった所に入学すると所得が低くなるという結論でも良さそう。

同一大学内のデータで、推薦と一般入試で差が出るかは気になる。

： １３２人目の素数さん [sage] 2013/05/21(火) 20:08:05.32

統計的な手段で得た推論を発表する前に、

「原因と結果が入れ替わっているのではないか？？」

と考える事が重要だと思う。

「ローマ法王になると長生きできる」とかと同じ。

： １３２人目の素数さん [sage] 2013/05/21(火) 20:11:32.06

「分数のできない大学生」に対抗して、「統計のできない大学教授」のタイトルで誰か本を書いてくれ！！

： １３２人目の素数さん [sage] 2013/05/21(火) 20:46:36.51

こっちにも同じニュースあり。
新聞社は、基本的に学者の出張は吟味せずに鵜呑みなのかね。

東大よ、その入試で大丈夫か？　“骨抜き受験”に見る所得格差…
外部リンク

ttp://headlines.yahoo.co.jp/hl?a=20130520-00000519-san-soci

： １３２人目の素数さん [] 2013/05/22(水) 17:47:04.74

>>61

持論に都合の良いデータだけ出してそう

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [sage] 2013/05/28(火) 00:40:51.59

>>61

>同一大学内のデータ

これを示さないのがダメだな。

： １３２人目の素数さん [] 2013/05/28(火) 21:47:25.45

すいません

野球で四球、単打、二塁打、HRとあります（三塁打は無視します）
ここでそれぞれ単独での得点との相関係数を左から、0.3、0.3．0.55、0.63としたとき

①正の相関性が強い指標になるほど、得点が増えやすい・・・という表現は正しいか？
（規則正しく得点が増えやすい＝増える確率が高いという解釈でも可）

②仮に一番左の四球の相関係数がゼロだったとします
この時、四球と得点との関連性が見られないので得点に貢献してるとは言い難い、で合ってますか？

： １３２人目の素数さん [sage] 2013/05/28(火) 22:04:33.98

ホームランと得点の相関が低いような指標でいいのか？
野球で得点に貢献するということの意味を考え直すべき

： １３２人目の素数さん [sage] 2013/05/28(火) 22:15:35.83

>>68

1は合ってると思う
2はサンプル数が十分あれば言えると思う

： １３２人目の素数さん [sage] 2013/05/28(火) 22:18:36.11

四球の多い投手に対して待球作戦をとって勝った場合、四球は勝利得点に貢献するが
打たないので大量点にはならず他の試合で打ちまくってると統計ではチーム得点と逆相関になる
この場合、得点に貢献してないと言うか？

： 68 [] 2013/05/28(火) 22:39:08.44

うわぁ、返事が早くて感動ｗ

>>69

全部合わせてOPS（長打率＋出塁率）にすると、相関係数0.940くらいにはなります
（15年間くらいのNPBデータで）

>>70

ありがとうございます

>>71

勝敗は無視して、あくまで得点との相関だけです
膨大な試合数での話なんで、展開とかは無視してもいいような？

： 68 [] 2013/05/28(火) 22:45:54.99

もう一つ質問です

得点に関係した指標で、四死球、安打・長打・盗塁などさまざまなものがあります
それぞれ単体での相関係数（影響度）が出ますよね？

この場合、各指標の得点への貢献度を比較する時、まず相関係数の高いものと
指標ごとの個数の多少を尊重する・・・こういう考えで合ってますか？

いやね、とある掲示板で

「指標ごとの相関係数と貢献度なんか全く関係ない！
仮に四球と得点の相関がゼロでも平均得点÷平均四死球が大きければ貢献度は高い」
とおっしゃる方がいまして・・・

僕の考えは
「相関係数がゼロならそもそも影響力がないと見て、貢献度を判断する価値がない」
と思ってるんですが、どっちが合ってます？

： １３２人目の素数さん [sage] 2013/05/28(火) 23:17:53.07

得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

あなたの議論している指標が上の例に当てはまるかと言う
質問ならどちらとも言えない

： 68 [] 2013/05/28(火) 23:29:54.52

>>74

ありがとうございます

①＞得点との相関係数が高い指標から順番に見ることで
得点への貢献度が良く説明できるかと言う質問ならノー

②＞得点との相関係数は低いが得点への影響力が
高い指標は作れるかと言う質問ならイエス

よろしければ、①と②についてそれぞれ理由を教えていただけたら嬉しいです

： １３２人目の素数さん [sage] 2013/05/29(水) 00:55:35.58

敢えて極端な例を挙げる
現実との折り合いは自分で考えて

打撃力に関係する指標と得点との相関が軒並み0.8くらいだったとする
一方、走力に関係する指標の相関は軒並み0.3くらいだったとする
打撃力に関係する指標をいくら組み合わせても相関は0.8から大して
伸びないだろうが、走力も考慮することで得点能力の説明可能性が
上がると期待できる

日時、試合場、打順等から一意な数字を作る
この数字と得点との相関は限りなく0に近いだろうが、
この数字を指定されれば各打席における得点を誤差0で説明できる

： １３２人目の素数さん [sage] 2013/05/29(水) 02:51:55.94

勝率への貢献度を無駄な得点への貢献度に摺り替えてるみたいだな

： あぼーん [あぼーん]

あぼーん

： １３２人目の素数さん [sage] 2013/05/30(木) 17:48:57.47

統計始めたばかりのバカからの質問です

「あるデータが◯◯分布に従う」という根拠は何ですか？

： １３２人目の素数さん [sage] 2013/05/30(木) 21:04:53.15

とくにない

： １３２人目の素数さん [sage] 2013/05/30(木) 23:52:26.33

分布グラフを見て比べるくらいだな

： １３２人目の素数さん [sage] 2013/06/14(金) 18:25:35.31

プロ野球のボールの反発係数は、0．4134～0．4374に収まるように
定められているが製造する際の目標値は下限の0.4134であった。
このときの不良率の推定値は？

： １３２人目の素数さん [sage] 2013/06/16(日) 14:55:18.67

標準偏差について質問です
σとはばらつき具合を数字で現すと聞いたんですが
何を基準にばらつきが大きいとか小さいを決めてるんですか？

： １３２人目の素数さん [sage] 2013/06/16(日) 17:31:17.29

例えば条件を変更した結果の比較とかはＦ検定を使う

： １３２人目の素数さん [sage] 2013/06/16(日) 18:07:38.69

平均±σの範囲に入るデータが68％ってどういう意味ですか？
例えば100個のデータがあるとして平均±σの範囲にデータが50％しか入ってなかったらばらついてる、とかそういう意味ですか？

： １３２人目の素数さん [sage] 2013/06/16(日) 22:00:01.74

>>85

ばらつけばばらつくほどσは大きくなるんだが

： １３２人目の素数さん [sage] 2013/06/16(日) 22:46:26.30

つまりばらつきが小さかろうが大きかろうが平均±σの範囲には必ず68％のデータがあるということですか？

： １３２人目の素数さん [sage] 2013/06/16(日) 23:14:19.00

正規分布していればな

： １３２人目の素数さん [sage] 2013/06/16(日) 23:31:36.05

ありがとうございます。
だとすれば何を基準にばらつきがあるとかないとか言えばいいんですか？
計算してσを出して何をもって、何と比較してこのσは大きいからばらつきがある、とか言えるんでしょうか

： １３２人目の素数さん [sage] 2013/06/16(日) 23:50:11.23

100は大きいのか？小さいのか？
何を基準にそう判断するのか？

： １３２人目の素数さん [sage] 2013/06/17(月) 00:19:27.38

>>89

ばらつきなんて相対的なもので、
比較するものがなければ、そもそも大きいとも小さいとも言えない。
だから「何を基準に」と言われても、
逆に「貴方の基準は何ですか？」と逆質問するしかない。

： １３２人目の素数さん [sage] 2013/06/17(月) 08:03:01.68

>>82

1σ=0.4373-0.4134のとき約66%
2σ=0.4373-0.4134のとき約52%
3σ=0.4373-0.4134のとき約50%

： １３２人目の素数さん [] 2013/06/20(木) 23:52:41.91

統計学は破綻している学問だと前に聞いたことがあるんだが
本当なの？

： １３２人目の素数さん [sage] 2013/06/21(金) 00:32:10.58

何をもって破綻しているのか分からないけど
モデル選択をミスって理論と現実がかけ離れてしまうってのはよくあること

： １３２人目の素数さん [sage] 2013/06/21(金) 01:10:05.92

デタラメ言って気を引こうとする奴はどこにでもいるな
常識で判断できる事だ

： １３２人目の素数さん [sage] 2013/06/21(金) 01:33:10.09

ちょっと質問です。
2つの変数の値の分布がどんな感じになってるかを表す指標がほしいなと思って
wikipediaで相関係数のページ見てみたんだけど、ページ右上の画像を見ると分布が全然違うのに
相関係数が同じだったりして、あんまり良くないなと思いました。
分布における形やばらつきのような、分布の特徴を表す指標ってどういうのがいいんでしょう？
1つポンと数値がでなくても複数組み合わせでもいいんですが、何かありますか？

： １３２人目の素数さん [sage] 2013/06/21(金) 02:17:22.30

2次元分布見れば

： １３２人目の素数さん [] 2013/06/21(金) 02:28:26.82

>>95

どういうこと？

： １３２人目の素数さん [sage] 2013/06/21(金) 09:03:10.50

>>96

1変数の関数がどんな感じになってるかを表す指標と同じでいいよ

100

： １３２人目の素数さん [sage] 2013/06/26(水) 21:42:41.23

>>89

>だとすれば何を基準にばらつきがあるとかないとか・・・・・・・・・・・・
工業製品の場合、ばらつきが大きい・小さいの基準は、その品質規格だ。
規格上下限範囲より大きければばらつき大・小さければばらつき小だよ。

101

： １３２人目の素数さん [sage] 2013/06/29(土) 11:28:51.92

ジョエル・ベストのこのイカサマ統計警鐘新刊は、一読に価しますか？
前著「統計はこうしてウソをつく」よりも、秀作ですか？
「あやしい統計フィールドガイド―ニュースのウソの見抜き方」　Ｊ・ベスト　白揚社　2011.12
外部リンク

ttp://www.hakuyo-sha.co.jp/cgi-bin/search.cgi?mode=detail&id=401

102

： １３２人目の素数さん [sage] 2013/07/01(月) NY:AN:NY.AN

すみません、初学者ですが、例えばt検定の解説でt分布の山形のグラフが描かれて、有意水準5%ならこっからここまでの面積を足すと5%だからここに入ったら棄却ですねと説明されますが、
5%の線を引いたとき、ちょうどその線上にt値がきたときは、どうするのでしょうか？
稀だし、そんなきわどい値になるなら実験とかやり直した方がいいとは思うのですが、棄却域を求める計算の際に、t>=●●としてもt>●●としても、
tの確率密度は連続関数だから意味は同じであるといった解説もあり、はて線上の扱いはどうなるんだろうと気になったものですm(_ _)m

103

： １３２人目の素数さん [sage] 2013/07/02(火) NY:AN:NY.AN

有意水準5%はどう決めたのか？

104

： １３２人目の素数さん [] 2013/07/03(水) NY:AN:NY.AN

スピアマンの順位相関を使って分析したのですが、事後分析として検定力を算出したいと思っています。
ピアソンrの場合と同様に計算してはいけない気がするのですが、どなたかご存知でしたら教えてください。

105

： １３２人目の素数さん [sage] 2013/07/03(水) NY:AN:NY.AN

>>104

ちょうとあなたと同じ質問をした人がいるよ。
外部リンク

ttp://www.stata.com/statalist/archive/2008-06/msg00652.html

で、参考になるかも知れない論文
外部リンク

ttp://biostat.georgiahealth.edu/Journal%20Club/bonett_wright_2000.pdf

106

： １３２人目の素数さん [] 2013/07/03(水) NY:AN:NY.AN

しっぽ確率ってそんなに便利かな
しっぽ確率使わないでゴリ押し計算で十分な気がしてきた
それともしっぽ確率使わないとヤバイような計算があるのかな

107

： １３２人目の素数さん [] 2013/07/03(水) NY:AN:NY.AN

>>105

ありがとうございます。
ただ、これはSTATAというソフトを使った解答かと思うのですが・・・
いったん読んでみます。

108

： １３２人目の素数さん [sage] 2013/07/03(水) NY:AN:NY.AN

きょうコレあやたんｷﾀ━━━━(ﾟ∀ﾟ)━━━━!!

109

： １３２人目の素数さん [sage] 2013/07/03(水) NY:AN:NY.AN

>>107

統計ソフトの種類とかが本質的な訳ではなく、
「事後に検出力の計算なんかしてんじゃねーよ、
だいたいSpearmanで分析する前にサンプルサイズはどうやって計算したんだ」
って質問者が怒られているのが問題の核心。

110

： １３２人目の素数さん [] 2013/07/04(木) NY:AN:NY.AN

>>109

　
仰るとおりです。
ただ、もともとはピアソンrでやるつもりだったので。
パラメトリックの前提が確認できなかったためやむなくスピアマンにしたのです。
問題の核心よりも、できれば事後にスピアマンで検定力を出す方法を教えていただきたいです。

111

： １３２人目の素数さん [sage] 2013/07/08(月) NY:AN:NY.AN

以下のようなことをしたいのですが、何か手法がないか分かる方はいないでしょうか。

いくつかの変数からなる100レコードや1000レコードのローデータを
複数のグループに可能な限り均等に分けたいです。

例えば男性70人、女性30人のデータがあったとして、これを5グループに分けたい場合、
各グループとも男性14人、女性6人の20人×5グループ。

さらにある変数の値がAの人が50、Bの人が50ならば男性女性の均等配分をなるべく維持したまま
各グループとも男性14人、女性6人、A10人、B10人の20人×5グループ。

ただし、当然ながらクロスを取れば男女とABの偏りがあるはずなので、
この例のようにぴったりな配分にはなりません。

均等配分したい変数は5つの時もあれば7つの時もあり、
分けたいグループ数も3の時もあれば6の時もあります。

全ての変数を完全に均等になるようにグループ分けすることは不可能でも、
各グループの総人数はきれいに分けて、その内訳の変数の値は
可能な限り均等に近い最適化された分類にしたいです。

色々調べたら層別ランダム化とか最小化法動的割付とか、そんな言葉が出てきて
それが近い結果を出せるのかという気がしたんですが。
SPSSで可能でしょうか？

112

： １３２人目の素数さん [sage] 2013/07/08(月) NY:AN:NY.AN

>>111

層別化無作為抽出で正解。
Rなら出来るけどSPSSはしらん

113

： １３２人目の素数さん [sage] 2013/07/11(木) NY:AN:NY.AN

>>112

Rですか、使ったことがないです。
コマンドラインで動くからちょっとこれだけやりたい、というには難しそうですね。
とりあえずRスレに行ってみます。

114

： １３２人目の素数さん [] 2013/07/12(金) NY:AN:NY.AN

線形変換って何の為にあるの？

115

： １３２人目の素数さん [] 2013/07/13(土) NY:AN:NY.AN

例えば平均μ,分散σ^2の正規分布から平均０、分散１の標準正規分布に変換するのだって
線型変換だし他にもいろいろ使い道あるんじゃない？多変数になってくると特に
嘘だったらごめんね☆

116

： １３２人目の素数さん [sage] 2013/07/16(火) NY:AN:NY.AN

味噌汁の味見のように一事をもって万事を量るのが統計学の任務ですが、
世論調査などではちゃんとかき混ぜているのでしょうか？

117

： １３２人目の素数さん [sage] 2013/07/16(火) NY:AN:NY.AN

>>116

そんなものは調査デザインによる。
固有の調査名とその調査デザインが提示されない限り、
意味のない質問。

118

： １３２人目の素数さん [sage] 2013/07/17(水) NY:AN:NY.AN

測度論を使ってないから分りやすい統計学の本っていうけど
測度論を使った統計学の本なんてみたことないんだけど
本当にあるの？

119

： １３２人目の素数さん [] 2013/07/17(水) NY:AN:NY.AN

測度論そのものかは知らないけどLebesgue&#8211;Stieltjes integrationとかなら普通にあるんじゃね？
ただ理論そのものは俺も見たことはないなあ(^q^)ｵﾜｯ

120

： １３２人目の素数さん [sage] 2013/07/18(木) NY:AN:NY.AN

コルモゴロフ本は確率を測度で定義してたと思うが不満か？

121

： １３２人目の素数さん [sage] 2013/07/18(木) NY:AN:NY.AN

確率論と統計学は違うだろ。

122

： １３２人目の素数さん [sage] 2013/07/18(木) NY:AN:NY.AN

>>119

マジかよ。その本教えろよ。
ルベーグステルチェス積分ってリーマンステルチェス積分とは違って
ルベーグ積分のステルチェス測度を使った積分だぞ？

123

： １３２人目の素数さん [sage] 2013/07/18(木) NY:AN:NY.AN

7/4宵、NHK「クローズアップ現代」曰く、目下統計学ブームだとか。番組冒頭には、狩野裕
阪大教授の講義光景が出てきた。統計家に企業求人が引く手数多というのは本当なのか？
”統計学を使いこなす「データサイエンティスト」が、多くの企業から引く手あまたの状況・・・・・・・・・・”
クローズアップ現代　「数字のカラクリ・データの真実～統計学ブームのヒミツ～」
ゲスト：サイエンス作家…竹内薫，成蹊大学教授・統計学者…岩崎学　　キャスタ：国谷裕子
外部リンク

ttp://www.nhk.or.jp/gendai/yotei/#3375

124

： １３２人目の素数さん [] 2013/07/19(金) NY:AN:NY.AN

最近ビッグデータビッグデータって喧しいけど
データ分析で使う統計学に何か本質的な違いあるんですか？

125

： １３２人目の素数さん [sage] 2013/07/19(金) NY:AN:NY.AN

IT屋のビジネスだよ。
おまけでログのテキスト分析が付いていてそっちは原則統計だね。
ただ学術的に怪しい式が結構混じってる。

126

： １３２人目の素数さん [sage] 2013/07/19(金) NY:AN:NY.AN

>>125

ビッグデータビッグデータと喧伝し始めたのは、IT企業でなく
マーケティング業界でなかったか？
SNS上やInternet上に溢れるカテゴリデータを、商売にどう使おうかと。
学術的に怪しい式というのは、何を求める式のことなの？

127

： １３２人目の素数さん [sage] 2013/07/21(日) NY:AN:NY.AN

7/21NHK7時のニュースで臙脂色ワンピミニスカ江崎史恵アナが、国内宿泊旅行
統計棒グラフを指し示して、ここ10年で国民の国内宿泊旅行回数が年平均
1.5回から1.2回に漸減し続けており、その原因が斯く斯く然々と微笑みながら
説明していた。その棒グラフには、年代別折れ線グラフが重ね描きされた。
こういう統計って、誰がどのように採っておるのだろ？
Web検索すると、観光庁の「宿泊旅行統計調査」がhitしたんだが、調査対象が
旅館・ホテル事業者とあってニュースのとは違っていた。　　

128

： １３２人目の素数さん [] 2013/07/21(日) NY:AN:NY.AN

旅行・観光消費動向調査

129

： １３２人目の素数さん [] 2013/07/23(火) NY:AN:NY.AN

朝倉書店の「ロジスティック回帰分析―SASを利用した統計解析の実際」を読むと、プロファイル（変数の組み合わせパターン別の発生件数とか）を作ってから係数を最尤推定するとあります。
一方Rのglm関数ではプロファイルは作らず観測値からIRLSで係数を推定するとありますが、この２つの方法での推定値って一致するんでしょうか？

130

： １３２人目の素数さん [sage] 2013/07/23(火) NY:AN:NY.AN

自分でやればわかるやろ

131

： １３２人目の素数さん [] 2013/07/23(火) NY:AN:NY.AN

２、区間推定（分散）：地域経済
我が国の都道府県別納税者1人当たりの課税対象所得額（万円/人）は正規母集団N(μ、σ２)を呈することが予想されている。いま任意の10都道府県についてこの値を調査したところ下記の数値を得た
　199.4, 177.9, 190.8, 241.9, 246.8, 213.9, 224.4, 226.1, 184.0, 200.5
１）このとき、全国平均μが未知であるとして母分散σ２を信頼係数95%で推定せよ
２）また、全国平均μが207.2万円であるとして母分散σ２を信頼係数95%で推定せよ

お前らの力を見せてみろ

132

： １３２人目の素数さん [sage] 2013/07/23(火) NY:AN:NY.AN

ふと思ったんだけど、中央値の逐次更新（オンライン処理）ってどうやるんだろう？
平均値とか分散ならちょっと計算したら漸化式にできるけど

133

： １３２人目の素数さん [sage] 2013/07/23(火) NY:AN:NY.AN

過去データ全部抱えていないと無理でね？

134

： １３２人目の素数さん [sage] 2013/07/23(火) NY:AN:NY.AN

収束する前提なら適当に分散推定しながら
中央付近のビンだけ更新しとけばできそうだな

135

： １３２人目の素数さん [] 2013/07/23(火) NY:AN:NY.AN

ある企業の発売以降の月次売上数(金額ではない)が、基本、対数近似を描くようだが、そんなこと、一般的に証明する方法はありますか？

136

： あぼーん [あぼーん]

あぼーん

137