![AIGC原理与实践:零基础学大语言模型、扩散模型和多模态模型](https://wfqqreader-1252317822.image.myqcloud.com/cover/190/51549190/b_51549190.jpg)
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.2 生成模型的概率表示
如何从一组观察数据中学到符合要求的模型pmodel?模型pmodel可看作一条曲线,如图1-5右图所示。而神经网络可以拟合任何一条曲线,为此我们可以通过神经网络来构建模型pmodel。假设一组样本构成的数据集为χ,神经网络的参数集为θ(如可表示神经网络中权重参数w及偏置b等),我们要求的分布函数可表示为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/18_02.jpg?sign=1739090305-6RXfIpaRUXPsKY98wISfRnsKM2cNB596-0-300455609eabd5d8f872acad80b2911f)
对于给定的观察数据x,参数θ的似然函数(即在参数化的模型中观察到的样本数据的概率,第13章有进一步的说明)为:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_01.jpg?sign=1739090305-YXCManAobbi60AXpah5QEh2z9nNwrjUk-0-63d35dae1e4bba6923a5666d84919f24)
如果数据集χ由一组独立同分布的样本x构成,即χ={x1,x2,…,xn},则数据集χ的似然函数可表示为;
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_02.jpg?sign=1739090305-qIHIhfjiBDb6h2i6r9UEAomo7fxvm3gy-0-f2dfdd2977251427a818ebd47a656020)
由于概率乘积的计算难度较大,我们一般采用对数似然函数:
![](https://epubservercos.yuewen.com/B4645E/30403237107613906/epubprivate/OEBPS/Images/19_03.jpg?sign=1739090305-qdtxWYDs5Mct00HocPPB98cDa8MI7KFR-0-7cfd56469003673b813040f4e735093c)