老师好,蓝色线咋推出的绿色线啊?
李坏_品职助教 · 2024年08月20日
嗨,从没放弃的小努力你好:
logistic回归是专门针对y是0/1分布的问题,所以这里的公式都是假设y是0或者1这两种情况的。类似于抛硬币问题,y要么是正面(y=1),要么是反面(y=0)。
你说的公式应该是极大似然函数。
这个函数是为了用一个变量(L)同时能够代表y=1和y=0两种取值下的概率。y=0的时候,L=1-F(y);y=1的时候,L=F(y)。
L类似于两种情况下概率的乘积,最后对L求极大值,即可得到当概率最大的情况下,对应的参数α和β。
α和β是隐藏在F(y)也就是藏在P里面:
这些计算的数学推导是不会考你的,了解结论即可。
----------------------------------------------努力的时光都是限量版,加油!
梦梦 · 2024年08月22日
明白了,也就是这个和离散分布,二项分布无关,对吧?
李坏_品职助教 · 2024年08月18日
嗨,爱思考的PZer你好:
y要么是0,要么是1.
也就是说Log(L)就是由y=0和y=1这两种情况加起来的。
如果y=0, 那么Log(L) = ∑[0 * log(F(yj)) + log(1-F(yj))] = ∑log(1-F(yj)),
如果y=1, 那么Log(L) = ∑log(F(yj)),
最后把这俩加起来,就得到了绿色线的公式。
----------------------------------------------虽然现在很辛苦,但努力过的感觉真的很好,加油!
梦梦 · 2024年08月19日
明白了,还有一个问题,P(X1)为什么等于P^y1*(1-P)^(1-y1)呢?y1要么等于1,要么等于0,并不是事件发生的次数啊?我是比对的二项分布的公式