p值是什麼意思,迴歸分析p值是什麼意思?

2021-09-17 08:33:49 字數 5019 閱讀 4190

1樓:匿名使用者

統計學意義(p值)zt

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推匯出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態。

2樓:匿名使用者

p值**於六西格瑪管理,是用來判定假設檢驗結果的一個引數,也可以根據不同的分佈使用分佈的拒絕域進行比較。

p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。總之,p值越小,表明結果越顯著。

但是檢驗的結果究竟是「顯著的」、「中度顯著的」還是「高度顯著的」需要我們自己根據p值的大小和實際問題來解決。

迴歸分析p值是什麼意思?

3樓:假面

p值是拒絕原假設的值。

迴歸係數p的檢驗是t檢驗,當p<α值,即迴歸係數顯著,拒絕原假設。

迴歸模型檢驗是檢驗模型是否合適,通過f檢驗,當f檢驗p<α,則模型顯著,即反映的總體迴歸。

通過這兩種檢驗,而且符合經濟自然規律後的模型可**。

4樓:數學易課

p值是 拒絕原假設的值

迴歸係數b的檢驗 是 t檢驗 當p<α值 即迴歸係數顯著 拒絕原假設

迴歸模型檢驗 是檢驗模型是否合適 通過f檢驗 當f檢驗p<α 則模型顯著 即反映的總體迴歸

通過這兩種檢驗 而且符合經濟自然規律後的模型可**

「p值」是什麼意思?

5樓:天蠍大山的子孫

p值(p value)就是當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率。如果p值很小,說明原假設情況的發生的概率很小,而如果出現了,根據小概率原理,我們就有理由拒絕原假設,p值越小,我們拒絕原假設的理由越充分。總之,p值越小,表明結果越顯著。

但是檢驗的結果究竟是"顯著的"、"中度顯著的"還是"高度顯著的"需要我們自己根據p值的大小和實際問題來解決。

r·a·fisher(1890-1962)作為一代假設檢驗理論的創立者,在假設檢驗中首先提出p值的概念。他認為假設檢驗是一種程式,研究人員依照這一程式可以對某一總體引數形成一種判斷。也就是說,他認為假設檢驗是資料分析的一種形式,是人們在研究中加入的主觀資訊。

(當時這一觀點遭到了neyman-pearson的反對,他們認為假設檢驗是一種方法,決策者在不確定的條件下進行運作,利用這一方法可以在兩種可能中作出明確的選擇,而同時又要控制錯誤發生的概率。這兩種方法進行長期且痛苦的論戰。雖然fisher的這一觀點同樣也遭到了現代統計學家的反對,但是他對現代假設檢驗的發展作出了巨大的貢獻。

)fisher的具體做法是:

假定某一引數的取值。

選擇一個檢驗統計量(例如z 統計量或z 統計量) ,該統計量的分佈在假定的引數取值為真時應該是完全已知的。

從研究總體中抽取一個隨機樣本計算檢驗統計量的值計算概率p值或者說觀測的顯著水平,即在假設為真時的前提下,檢驗統計量大於或等於實際觀測值的概率。

如果p<0.01,說明是較強的判定結果,拒絕假定的引數取值。

如果0.01如果p值》0.05,說明結果更傾向於接受假定的引數取值。

可是,那個年代,由於硬體的問題,計算p值並非易事,人們就採用了統計量檢驗方法,也就是我們最初學的t值和t臨界值比較的方法。統計檢驗法是在檢驗之前確定顯著性水平α,也就是說事先確定了拒絕域。但是,如果選中相同的α,所有檢驗結論的可靠性都一樣,無法給出觀測資料與原假設之間之間不一致程度的精確度量。

只要統計量落在拒絕域,假設的結果都是一樣,即結果顯著。但實際上,統計量落在拒絕域不同的地方,實際上的顯著性有較大的差異。

因此,隨著計算機的發展,p值的計算不再是個難題,使得p值變成最常用的統計指標之一。

求問統計學裡的p值是什麼含義?請用通俗易懂的語言解釋,謝謝!

6樓:語言學新兵

你需要的可能是一個故事。

從前,你有個朋友,他每月開一輛小貨車去市場裡採購東西,然後再把所有這些東西轉賣出去。月復一月,年復一年。

但是,因為市場**變動,每一個月他賣東西得到的毛爺爺數目並不一樣,差不多有個5000塊錢左右吧。你呢能看到他每個月的收入統計。

時間長了,有一次,無聊的你準備戲耍一下這個無辜的小夥伴,你偷偷在他的小貨車上裝了一小瓶尿。既然他肯定會在集市上賣掉所有東西,那麼這一小瓶尿他一定也會賣出去,只不過這瓶尿的**可能也就是零吧。

這一次他賺了5400塊,這可比以往的平均數5000塊錢還多。那問題就來了:為什麼這個月他賺的比平常多呢?

有兩種情況:其一,你那瓶尿很值錢,他自然會多賺;其二,你那瓶尿根本不值錢,他多賺了只是因為這個月市場上**不錯。

那到底是哪種情況呢?這個問題的實質是,你那瓶尿到底值不值錢。如果這瓶尿根本不值錢,那他賣東西和以前賣東西的情況沒什麼兩樣,只不過是市場**影響而已。

於是,你翻了他以前賣東西的紀錄,算了算所有他的個人月收入超過5400塊的概率,大概是0.1。也就是說在你這瓶尿沒有任何價值的情況下,只靠市場**,他只有0.

1的概率賣到5400塊。

所以你得出的結論是,你的那瓶尿有價值,你這個結論的p值就是0.1。

===================

故事講完了,來分析一下。

為什麼要用p值?換句話說,為什麼要做推斷統計?我想,p值到底是啥並不重要,我知道你做研究時多半隻是負責看看p到底有沒有比0.05小的。而這個問題,才是我最想告訴你的。

推斷統計,之所以要「推斷」,是因為我們沒有辦法正面驗證某種情況。在這個故事中,你以前沒幹過偷偷把一瓶尿放在車上的事兒,他以前也沒賣過你的尿,所以儘管你有的是他的銷售資料,但那些舊賬本沒辦法正面告訴你你的尿到底值不值錢。

這就是「沒辦法正面驗證」,在這樣的情況下,你就沒辦法了麼?非也,我們可以換個角度考慮這個問題,假設「你那瓶尿毫無價值」是成立的,他賣了這瓶尿跟沒賣時候沒什麼兩樣,那這一次和以往自然也沒什麼兩樣。既然這次賣東西和以往一樣,那舊賬本中的記錄就能幫到你了。

你可以算算舊賬本,他在沒賣過你那瓶尿的情況下,賺到5400塊及以上的可能性(概率),這個概率就是「你那瓶尿毫無價值」的概率,這裡也就是0.1.

這樣,「你那瓶尿有價值」的概率,當然就是這個假設的相反情況,也就是0.9,這也是你的假設成立的可能性。

那這個p值到底顯著與否呢?那得看市場**。這裡市場**是隨機的,所以「顯著」與否簡單點就是在說你那瓶尿能不能跑贏市場。

業內經常以兩個標準差作為衡量「顯著」的標準。絕大多數情況下,作為隨機變數的市場**服從正態分佈。而正態分佈中,超過兩個標準差的概率是0.

05,這也就是為什麼大家要拿0.05作為「公認」的顯著性水平尺度了。

統計推斷,核心就是反證法。你那瓶尿沒價值的可能性越小,反而越能證明你那瓶尿有價值。

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離」

這是你的書上寫的定義,但是很明顯,你把結尾最重要的「的概率」三個字漏掉了。正常情況下,這個定義應該是

「在原假設成立的情況下抽到的統計量與原假設之間的距離至少等於樣本計算值與原假設之間的距離的概率」

不信你可以再看看你的書。

但是,怎麼可以容忍這麼***的定義?我們來用這個故事做個轉換吧:

「在原假設成立的情況下」 -> 在你那瓶尿不值錢情況下

「抽到的統計量與原假設之間的距離」 -> 他舊賬本里的銷售記錄

「至少等於」 -> 大於或等於

"樣本計算值與原假設之間的距離" -> 他這一次的銷售記錄(5400塊)

「的概率」 -> 的概率

連起來讀讀,p值的定義就變成:

「在你那瓶尿不值錢的情況下,他舊賬本里的銷售記錄大於或等於他這一次的銷售記錄(5400塊錢)(這個事件發生)的概率。」

這一次,好懂了點嗎?

最後要說明,說得通俗易懂是要承擔風險的,因為通俗很可能意味著不嚴謹,易懂很可能意味著不周全。以上有很多有失嚴謹之處,希望題主還要多多看書哇。

最後的最後,為什麼我要用「一瓶尿」這樣一個非常粗俗**的故事?因為所謂的p value,不就是用來證明你的pee value的麼?

個人觀點,僅供參考!

概率P值即Sig 值的翻譯是 什麼意思

概率p值即sig值。翻譯成英文是 the probability p value is the sig value.注 請提問者及時採納答案!spss中t值和sig值代表什麼意思 急!5 1 t值表示 逐個檢驗各自變數 迴歸 2 sig值包含p值。無論資料 sig 的顯著性是 顯著性 中度顯著性 還...

p2p理財是什麼意思?安全嗎P2P理財是什麼意思?安全嗎?

peer to peer翻譯過來就是個人對個人 就是債權的轉讓理財的一種 一般由從事這樣的理財公司作為中介,需要錢的客戶從公司貸款,有閒錢的客戶可以做理財,把貸款的債權轉給做理財的客戶 所得的收益也就是他們的利息 差不多 一般收益較高,金額不等 比銀行理財要高出很多,時間期限不等比較靈活。我用過的朋...

統計學中的p值是什麼意思怎麼計算

p值即概率,反映某一事件發生的可能性大小。不同的p數值所表達的含義也是不一樣的。統計學根據顯著性檢驗方法所得到的p 值,一般以p 0.05 為有統計學差異,p 0.01 為有顯著統計學差異,p 0.001為有極其顯著的統計學差異。其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 0.01 0.0...