网站地图官方微信:
网站首页 包装生产线 包装胶带 圆珠笔 学校家具 学习文具 学习机

当前位置: 首页 >

为什么我还是无法理解transformer?

不要想的太过复杂,就只有随机数生成的三个矩阵,原始输入已经通过矩阵相乘关联在三个随机数矩阵中,再通过一些代数游戏得到每个token对于整体输入序列的注意力权重矩阵,再和另外一个随机数矩阵进行线性的代数变化即可。

反向传播更新的是这三个矩阵的权重,三个矩阵的维度设计也是为了符合线性代数的运算。

总之这个就是一个巧妙的线性代数游戏,没有什么复杂的逻辑问题。

为什么我还是无法理解transformer?

  • | 为什么都认为无GC语言一定会比有GC语言要快? |

    Go往往跟Rust持平甚至超越这个观点是错误的,GO的性能很...

    查看详情>>
  • | 不给CPU安装散热器会发生什么? |

  • | 韦东奕(北大韦神)要是去写游戏引擎代码,能不能把虚幻引擎按在地上摩擦?数学好真能‘降维打击吗? |

  • | 如何看待不超过1879元的Mac mini(M4+16/256GB+票),易用性吊打同级其他台式电脑? |

  • | 国产手机AI「好用」的背后,是技术差距还是文化差异? |

  • | 你都见过什么样的电脑盲? |

  • | 怎么评价fastjson2? |

  • | 乔丹的身体素质放到现在是不是只能算平庸? |

  • | 男朋友说我穿衣服太开放,难道好身材不应该显示出来吗? |

  • | 你是在哪一瞬间突然感觉到苹果创新乏力的? |

  • | postgresql能取代mongodb吗? |

  • 这些年足坛冒出了一大批身高190,速度奇快的中后卫,他们的特...

    2025-06-26
  • 只谈斗殴野架。 说实话,从保护同胞角度出发,我建议如果你没练...

    2025-06-26
  • 我说个点。 年轻的女孩子的脚,你在本能上不会觉得是臭的。 很...

    2025-06-26
  • 我之前也是喜欢严格遵循restful规范,什么get,pos...

    2025-06-26

关注我们

添加微信好友,关注最新动态