Python知識(shí)分享網(wǎng) - 專業(yè)的Python學(xué)習(xí)網(wǎng)站 學(xué)Python,上Python222
28道數(shù)據(jù)分析經(jīng)典面試題 DOC 下載
匿名網(wǎng)友發(fā)布于:2023-12-10 10:58:13
(侵權(quán)舉報(bào))
(假如點(diǎn)擊沒反應(yīng),多刷新兩次就OK!)

28道數(shù)據(jù)分析經(jīng)典面試題 DOC 下載   圖1

 

 

資料內(nèi)容:

 

 

1. 撲克牌54張,平均分成2份,求這2份都有2A的概率。

M表示兩個(gè)牌堆各有2個(gè)A的情況:M=4(25!25!)

N表示兩個(gè)牌堆完全隨機(jī)的情況:N=27!27!

所以概率為:M/N = 926/53*17


2. 男生點(diǎn)擊率增加,女生點(diǎn)擊率增加,總體為何減少?

因?yàn)槟信狞c(diǎn)擊率可能有較大差異,同時(shí)低點(diǎn)擊率群體的占比增大。

如原來男性20人,點(diǎn)擊1人;女性100人,點(diǎn)擊99人,總點(diǎn)擊率100/120。

現(xiàn)在男性100人,點(diǎn)擊6人;女性20人,點(diǎn)擊20人,總點(diǎn)擊率26/120。

即那個(gè)段子A系中智商最低的人去讀B,同時(shí)提高了A系和B系的平均智商。”


3. 參數(shù)估計(jì)

用樣本統(tǒng)計(jì)量去估計(jì)總體的參數(shù)。

4. 假設(shè)檢驗(yàn)

參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)組成部分,它們都是利用樣本對(duì)總體進(jìn)行某種推斷,但推斷的角度不同。

參數(shù)估計(jì)討論的是用樣本估計(jì)總體參數(shù)的方法,總體參數(shù)μ在估計(jì)前是未知的。

而在假設(shè)檢驗(yàn)中,則是先對(duì)μ的值提出一個(gè)假設(shè),然后利用樣本信息去檢驗(yàn)這個(gè)假設(shè)是否成立。


5. 置信度、置信區(qū)間

置信區(qū)間是我們所計(jì)算出的變量存在的范圍,水平就是我們對(duì)于這個(gè)數(shù)值存在于我們計(jì)算出的這個(gè)范圍的可信程度。

舉例來講,有95%的把握,真正的數(shù)值在我們所計(jì)算的范圍里。

在這里,95%是置信水平,而計(jì)算出的范圍,就是置信區(qū)間。

如果置信度為95%, 則抽取100個(gè)樣本來估計(jì)總體的均值,由100個(gè)樣本所構(gòu)造的100個(gè)區(qū)間中,約有95個(gè)區(qū)間包含總體均值。


6. 協(xié)方差與相關(guān)系數(shù)的區(qū)別和聯(lián)系

協(xié)方差:
協(xié)方差表示的是兩個(gè)變量的總體的誤差,這與只表示一個(gè)變量誤差的方差不同。如果兩個(gè)變量的變化趨勢(shì)一致,也就是說如果其中一個(gè)大于自身的期望值,另外一個(gè)也大于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是正值。如果兩個(gè)變量的變化趨勢(shì)相反,即其中一個(gè)大于自身的期望值,另外一個(gè)卻小于自身的期望值,那么兩個(gè)變量之間的協(xié)方差就是負(fù)值。

 

相關(guān)系數(shù):
研究變量之間線性相關(guān)程度的量,取值范圍是[-1,1]。相關(guān)系數(shù)也可以看成協(xié)方差:一種剔除了兩個(gè)變量量綱影響、標(biāo)準(zhǔn)化后的特殊協(xié)方差。