Kosteneffectieve training: Technieken zoals managed spot instances, gradiënt checkpointing en flash-aandacht maakten kosteneffectieve training mogelijk van ongeveer $ 300 voor het 13B-model. Verbeterd ...