統計學總體中的代表什麼意思,統計學中的P值是什麼意思怎麼計算

2021-03-03 20:35:33 字數 5840 閱讀 9505

1樓:

代表總體的相關係數,r表示樣本的相關係數。

統計學中的「p」值是什麼意思?怎麼計算?

2樓:忘洛心

p值即概率,反映某一事件發生的可能性大小。

不同的p數值所表達的含義也是不一樣的。

統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為有統計學差異, p<0.01 為有顯著統計學差異,p<0.001為有極其顯著的統計學差異。

其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 、0.01、0.

001。實際上,p值不能賦予資料任何重要性,只能說明某事件發生的機率。統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

拓展資料:

計算p值的相關注意事項:

1、p的意義不表示兩組差別的大小,p反映兩組差別有無統計學意義,並不表示差別大小。因此,與對照組相比,c藥取得p<0.05,d藥取得p <0.01並不表示d的藥效比c強。

2、p>0.05時,差異無顯著意義,根據統計學原理可知,不能否認無效假設,但並不認為無效假設肯定成立。在藥效統計分析中,更不表示兩藥等效。

哪種將「兩組差別無顯著意義」與「兩組基本等效」相同的做法是缺乏統計學依據的。

3、統計學主要用上述三種p值表示,也可以計算出確切的p值,有人用p <0.001,無此必要。

4、顯著性檢驗只是統計結論。判斷差別還要根據專業知識。抽樣所得的樣本,其統計量會與總體引數有所不同,這可能是由於兩種原因。

p值的其他含義:

1、 一種概率,一種在原假設為真的前提下出現觀察樣本以及更極端情況的概率。

2、拒絕原假設的最小顯著性水平。

3、觀察到的(例項的)顯著性水平。

4、表示對原假設的支援程度,是用於確定是否應該拒絕原假設的另一種方法。

3樓:瑾

與「機率」不同,一個事件的機率(odds)是指該事件發生的概率與該事件不發生的概率的比值。

拓展資料:

關於統計定義

在一定條件下,重複做n次試驗,na為n次試驗中事件a發生的次數,如果隨著n逐漸增大,頻率na/n逐漸穩定在某一數值p附近,則數值p稱為事件a在該條件下發生的概率,記做p(a)=p。這個定義成為概率的統計定義。

在歷史上,第一個對「當試驗次數n逐漸增大,頻率na穩定在其概率p上」這一論斷給以嚴格的意義和數學證明的是雅各布·伯努利(jacob bernoulli)。

從概率的統計定義可以看到,數值p就是在該條件下刻畫事件a發生可能性大小的一個數量指標。

4樓:墨竹親親

統計學意義(p值)zt:

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

2.均值的計算:

在處理實驗資料或取樣資料時,經常會遇到對相同取樣或相同實驗條件下同一隨機變數的多個不同取值進行統計處理的問題。此時,多數作者會不假思索地直接給出算術平均值和標準差。顯然,這種做法是不嚴謹的。

在數理統計學中,作為描述隨機變數總體大小特徵的統計量有算術平均值、幾何平均值和中位數等。

拓展資料:

何時用算術平均值?何時用幾何平均值?以及何時用中位數?

1. 這不能由研究者根據主觀意願隨意確定,而要根據隨機變數的分佈特徵確定。反映隨機變數總體大小特徵的統計量是數學期望,而在隨機變數的分佈服從正態分佈時,其總體的數學期望就是其算術平均值。

此時,可用樣本的算術平均值描述隨機變數的大小特徵。

2. 如果所研究的隨機變數不服從正態分佈,則算術平均值不能準確反映該變數的大小特徵。在這種情況下,可通過假設檢驗來判斷隨機變數是否服從對數正態分佈。

3. 如果服從對數正態分佈,則可用幾何平均值描述該隨機變數總體的大小。此時,就可以計算變數的幾何平均值。

4. 如果隨機變數既不服從正態分佈也不服從對數正態分佈,則按現有的數理統計學知識,尚無合適的統計量描述該變數的大小特徵。退而求其次,此時可用中位數來描述變數的大小特徵。

5樓:fu我若為王

統計學中p一般指概率。

以古典概率模型為例,概率的計算方法為:

古典定義

如果一個試驗滿足兩條:

(1)試驗只有有限個基本結果;

(2)試驗的每個基本結果出現的可能性是一樣的。

這樣的試驗便是古典試驗。

其中n表示該試驗中所有可能出現的基本結果的總數目。m表示事件a包含的試驗基本結果數。

這裡,僅僅舉例了簡單的古典概率,其還有很多種模型。你可以找統計學的相關書籍進行學習。

拓展內容:概率亦稱「或然率」。它反映隨機事件出現的可能性大小的量度。

隨機事件是指在相同條件下,可能出現也可能不出現的事件。例如,從一批有**和次品的商品中,隨意抽取一件,「抽得的是**」就是一個隨機事件。設對某一隨機現象進行了n次試驗與觀察,其中a事件出現了m次,即其出現的頻率為m/n。

經過大量反覆試驗,常有m/n越來越接近於某個確定的常數。該常數即為事件a出現的概率,常用p (a) 表示,與「機率」不同,一個事件的機率(odds)是指該事件發生的概率與該事件不發生的概率的比值。

6樓:前行熊貓

p值即概率,反映某一事件發生的可能性大小。

統計學根據顯著性檢驗方法所得到的p 值,一般以p < 0.05 為有統計學差異, p<0.01 為有顯著統計學差異,p<0.

001為有極其顯著的統計學差異。其含義是樣本間的差異由抽樣誤差所致的概率小於0.05 、0.

01、0.001。實際上,p值不能賦予資料任何重要性,只能說明某事件發生的機率。

統計結果中顯示pr > f,也可寫成pr( >f),p = p或p = p。

假設檢驗是推斷統計中的一項重要內容。用sas、spss等專業統計軟體進行假設檢驗,在假設檢驗中常見到p值( p-value,probability,pr),p值是進行檢驗決策的另一個依據。

擴充套件資料:

p值由來

從某總體中抽

(1)、這一樣本是由該總體抽出,其差別是由抽樣誤差所致;

(2)、這一樣本不是從該總體抽出,所以有所不同。

如何判斷是那種原因呢?統計學中用顯著性檢驗來判斷。其步驟是:

(1)、建立檢驗假設(又稱無效假設,符號為h0):如要比較a藥和b藥的療效是否相等,則假設兩組樣本來自同一總體,即a藥的總體療效和b藥相等,差別僅由抽樣誤差引起的碰巧出現的。

(2)、選擇適當的統計方法計算h0成立的可能性即概率有多大,概率用p值表示。

(3)、根據選定的顯著性水平(0.05或0.01),決定接受還是拒絕h0。

如果p>0.05,不能否定「差別由抽樣誤差引起」,則接受h0;如果p<0.05或p <0.

01,可以認為差別不由抽樣誤差引起,可以拒絕h0,則可以接受另一種可能性的假設(又稱備選假設,符號為h1),即兩樣本來自不同的總體,所以兩藥療效有差別。

p值的計算:

一般地,用x 表示檢驗的統計量,當h0為真時,可由樣本資料計算出該統計量的值c,根據檢驗統計量x的具體分佈,可求出p值。具體地說:

左側檢驗的p值為檢驗統計量x 小於樣本統計值c 的概率,即:p = p

右側檢驗的p值為檢驗統計量x 大於樣本統計值c 的概率:p = p

雙側檢驗的p值為檢驗統計量x 落在樣本統計值c 為端點的尾部區域內的概率的2 倍:p = 2p (當c位於分佈曲線的右端時) 或p = 2p (當c 位於分佈曲線的左端時) 。若x 服從正態分佈和t分佈,其分佈曲線是關於縱軸對稱的,故其p 值可表示為p = p 。

計算出p值後,將給定的顯著性水平α與p 值比較,就可作出檢驗的結論:

如果α > p值,則在顯著性水平α下拒絕原假設。

如果α ≤ p值,則在顯著性水平α下接受原假設。

在實踐中,當α = p值時,也即統計量的值c剛好等於臨界值,為慎重起見,可增加樣本容量,重新進行抽樣檢驗。

統計學中的p值代表什麼?

7樓:mua小婷

我儘量用形象的語言說 p值越小 說明犯第一類錯誤的概率越小 你越可以推翻傳統的、保守的觀點 越可以接受新提出的、感興趣的觀點

什麼是第一類錯誤 統計上把保守的、傳統的觀點作為原假設 新穎的、感興趣的、想去論證的觀點作為備擇假設 就好比一個犯罪嫌疑人 在沒有確鑿的證據前都只能以他無罪為原假設 因為一個人無罪判他有罪 比 有罪判無罪 的後果嚴重的多 大家都不願被冤枉 所以推廣開來 你想證明一班的成績比二班好 原假設就設為一班二班成績相同 備擇假設就設為一班比二班成績好 若得出的p值較小 一般以0.05作為臨界值 比0.05小就可以接受一班成績比二班好的事實 若比0.

05大就說明沒有足夠證據證明一班成績比二班好 保守起見拒絕備擇假設 接受原假設純手打

8樓:lzpd藍色天空

結果的統計學意義是結果真實程度(能夠代表總體)的一種估計方法。專業上,p值為結果可信程度的一個遞減指標,p值越大,我們越不能認為樣本中變數的關聯是總體中各變數關聯的可靠指標。p值是將觀察結果認為有效即具有總體代表性的犯錯概率。

如p=0.05提示樣本中變數關聯有5%的可能是由於偶然性造成的。即假設總體中任意變數間均無關聯,我們重複類似實驗,會發現約20個實驗中有一個實驗,我們所研究的變數關聯將等於或強於我們的實驗結果。

(這並不是說如果變數間存在關聯,我們可得到5%或95%次數的相同結果,當總體中的變數存在關聯,重複研究和發現關聯的可能性與設計的統計學效力有關。)在許多研究領域,0.05的p值通常被認為是可接受錯誤的邊界水平。

在最後結論中判斷什麼樣的顯著性水平具有統計學意義,不可避免地帶有武斷性。換句話說,認為結果無效而被拒絕接受的水平的選擇具有武斷性。實踐中,最後的決定通常依賴於資料集比較和分析過程中結果是先驗性還是僅僅為均數之間的兩兩》比較,依賴於總體資料集裡結論一致的支援性證據的數量,依賴於以往該研究領域的慣例。

通常,許多的科學領域中產生p值的結果≤0.05被認為是統計學意義的邊界線,但是這顯著性水平還包含了相當高的犯錯可能性。結果0.

05≥p>0.01被認為是具有統計學意義,而0.01≥p≥0.

001被認為具有高度統計學意義。但要注意這種分類僅僅是研究基礎上非正規的判斷常規。

所有的檢驗統計都是正態分佈的嗎並不完全如此,但大多數檢驗都直接或間接與之有關,可以從正態分佈中推匯出來,如t檢驗、f檢驗或卡方檢驗。這些檢驗一般都要求:所分析變數在總體中呈正態分佈,即滿足所謂的正態假設。

許多觀察變數的確是呈正態分佈的,這也是正態分佈是現實世界的基本特徵的原因。當人們用在正態分佈基礎上建立的檢驗分析非正態分佈變數的資料時問題就產生了,(參閱非引數和方差分析的正態性檢驗)。這種條件下有兩種方法:

一是用替代的非引數檢驗(即無分佈性檢驗),但這種方法不方便,因為從它所提供的結論形式看,這種方法統計效率低下、不靈活。另一種方法是:當確定樣本量足夠大的情況下,通常還是可以使用基於正態分佈前提下的檢驗。

後一種方法是基於一個相當重要的原則產生的,該原則對正態方程基礎上的總體檢驗有極其重要的作用。即,隨著樣本量的增加,樣本分佈形狀趨於正態,即使所研究的變數分佈並不呈正態。

統計學中的Ci是什麼意思,統計學中 b se 2 p or 95 ci分別代表什麼意思

一.ci可用來估計bai總體引數.ci的範圍du愈窄,用樣zhi本指標估計總體引數的可靠dao性就愈好.二.進行假設回檢驗,95 的ci與 答 0.05的假設檢驗等價.當效應值是比值時,若95 的ci包含了1,等價於p0.05,無統計學意義.當效應值是差值是,若95 的ci包含了0,等價於等價於p0...

生物統計學hr是什麼意思生物統計學的差異顯著上角標怎麼標

風險比 hazard ratio,hr hr 暴露組的風險函式h1 t 非暴露組的風險函式h2 t t指在相同的時間點上 而風險函式指危險率函式 條件死亡率 瞬時死亡率。cox比例風險模型可以得到hr。資料的型別通常是臨床 性研究,也可以是流行病學的佇列觀察性研究。風險比和危害比。1 多數認為hr與...

統計學裡的全距是什麼意思 5,統計學裡的全距是什麼意思

統計學裡的全距是什麼意思 全距。全距是用來表示統計資料中的變異量數 measuresofvariation 其最大值與最小值之間的差距 即最大值減最小值後所得之資料。其適用於等距變數 比率變數,不適用於名義變數或次序變數。全距也稱為極差,是指總體各單位的兩個極端標誌值之差,即 r 最大標誌值 最小標...