深思考Dongni.ai
  
        产品
        优势
      
      / Product Advantages /
    
        技术
        参数
      
      / Technical Parameter /
    
              架构:DongniForCausalLM
            
          
            
              隐藏层维度: 10240,可以处理更多的细节
            
          
            
              最大上下文: 128K tokens
            
          
              注意力头数量: 每层80个的注意力头,模型在每一层可以处理更多的上下文信息
            
          
            
              隐藏层数量:96,更多的隐藏层让模型能够深入理解复杂的语义结构
            
          
              键值头数: 8
            
          
            
              RMS标准化: 1e-06,确保计算稳定
            
          
            
              词汇表大小:183542,以支持更多语言和领域的表达
            
          
