1、老师好,第一条红线的W111,W112,W113,角标的三个数字分别代表什么意思?截据是为什么不用b1?而用W1,W2,W3,W4有什么特殊意思吗?
2、第二条红线的,W211,W221,W231,角标的三个数字分别代表什么意思?
3、如果有两个hiden,怎么写表达式呢?能否举个例子
李坏_品职助教 · 2024年04月30日
嗨,从没放弃的小努力你好:
y1 = φ(w211 * H1 + w221 * H2 + w231 * H3 + w4)
y2 = φ(w212 * H1 + w222 * H2 + w232 * H3 + w4)
----------------------------------------------努力的时光都是限量版,加油!
梦梦 · 2024年05月01日
明白了,谢谢老师
李坏_品职助教 · 2024年04月29日
嗨,爱思考的PZer你好:
w 1234指的是每一个模型里面的截距项。比如初中学过的y = k*x + b直线方程,b就是这里的w1 2 3 4.
而其他的w表示每一个x在每一层相应的H里面的权重。
比如讲义里写的w111:第一个数字1代表第一层hidden,第二个数字1代表当前层级的第一个数(就是H1),第三个数字1代表x1.
所以w111的意思是第一层Hidden里面H1的第一个元素x1的权重。
以此类推,讲义里写的w122:第一个数字1代表第一层hidden,第二个数字2代表H2,第三个数字2代表x2.
这种写法是为了和原版书教材保持一致。
第二条红线,w211:第一个数字2代表第二层(第一层是H1 H2和H3,第二层直接就是ouput y了),第二个数字1代表H1,第三个数字1表示H1的第一个系数(因为第二层的每一个H到y这个过程中,每一个H只有一个系数,所以211,221,231最后都是1).
如果中间再加一个Hidden 2,那么前面Hidden1里面的H1到H3就可以看做是新的x1到x3:
Hidden2:
H1' = φ(w211*H1 + w212 * H2 + w213*H3 + w4),
H2' = φ(w221*H1 + w222 * H2 + w223*H3 + w5),
H3' = φ(w231*H1 + w232 * H2 + w233*H3 + w6),
最后y = φ(w311 * H1' + w321 * H2‘ + w331 * H3' + w7)
----------------------------------------------加油吧,让我们一起遇见更好的自己!
梦梦 · 2024年04月30日
1、但是图片显示,只有X1,X2连接到了H1这个圆圈,那为什么还有W113X3?这不是第一层,H1对应的X3的意思吗? 2、第二个数字1代表H1,第三个数字1表示H1的第一个系数(因为第二层的每一个H到y这个过程中,每一个H只有一个系数,所以211,221,231最后都是1),老师这里的第一个系数是指?
梦梦 · 2024年08月19日
1、“比如讲义里写的w111:第一个数字1代表第一层hidden,第二个数字1代表当前层级的第一个数(就是H1),第三个数字1代表x1.” 第一层hidden,是图里的H1吗?图里的H1是是第一层hidden的第一个unit,并不是第一层hidden。2、“每一个H只有一个系数,所以211,221,231最后都是1”怎么理解呢?不太明白