赛博朋克艺术表现与文化探析 本文将首先尝试对赛博朋克的核心概念进行界定和综述,通过对赛博朋克的视觉艺术发展历史及当时文化背景进行入手探究,以赛博朋克的主要作品发表顺序为主,尝试性的梳理赛博朋克的艺术视觉风格在不同时代、不同艺术作品下的艺术发展过程以及结合当时的文化背景分析为什么会有这样的演变。
事件驱动架构设计 事件驱动架构是通过事件的传播来实现跨越多个服务之间的业务逻辑的。事件驱动架构是一种设计应用的软件架构和模型,可以最大程度减少耦合度。其实现在 iOS、Android、JS 等等客户端的所谓的 发生了什么 -> 要做什么本质上都是事件驱动设计思想的衍生物。比如 Android 的广播、输入事件。让我们来看看事件驱动什么到底是什么吧!
Transformer 的绝对位置编码和相对位置编码 Transformer 恰好属于对位置不敏感的结构,所以我们需要额外给 Transformer 带上每一个字所在的位置。本文介绍了绝对位置编码和相对位置编码两种方式。
Mask 的那些事 Mask 的灵感是来自于完形填空。Transformer 结构包括编码器和解码器,在编码过程中目的就是为了让模型看到当前位置前后的信息,所以不需要 attention mask。但是在解码过程中为了模拟在真实的 inference 场景中,当前位置看不到下一位置,且同时需要上一位置的信息,所以在训练的时候加了attention mask。能很有效提升泛化性。
知识蒸馏下两个模型的匹配程度? 现代的知识蒸馏中,我们发现学生模型可以与教师模型有着不同的预测结果,即使学生模型能完美匹配教师模型。尝试的去比较学生模型的泛化能力与匹配程度的相关性。泛化性指模型经过训练后,应用到新数据并做出准确预测的能力、匹配程度则能更好反映了学生模型蒸馏到了多少教师模型含有的知识。
Kvrocks 架构设计详解 Kvrocks 是基于 RocksDB 之上兼容 Redis 协议的 NoSQL 存储服务,设计目标是提供一个低成本以及大容量的 Redis 服务,作为 Redis 在大数据量场景的互补服务,选择兼容 Redis 协议是因为简单易用且业务迁移成本低。
从 R-Drop 到 KL 散度 在《R-Drop: Regularized Dropout for Neural Networks》引入了一种一致性的训练策略来规范化 dropout,称为 R-Drop。
浅析 Text and Code Embeddings by Contrastive Pre-Training 文本向量是在很多应用和文本相似度、语义搜索上有很大的应用。之前的工作通常是根据不同的应用来选择数据集定制模型架构。《Text and Code Embeddings by Contrastive Pre-Training》中展示无监督的对比学习可以获得更好的文本向量,并且在这个方法下得到的文本向量在 linear-probe 分类上达到了 SOTA(state-of-the-art),也有着很好的语义搜索能力,甚至可以与 fine-tuned 后的模型比较。
极大极小及剪枝算法 极大极小算法常用于二人博弈游戏,目的是寻找最优的方案使得自己能够利益最大化。而剪枝是希望在搜索的时候,根据已搜索的结果,剔除超出最优解的分支,那么意味着这个分支下的所有节点都不需要考虑了,大大降低了搜索的次数。
基于 QPS 与资源利用率转换的过载应对 QPS(Query Per Second):每秒查询率QPS是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。我们常常使用 QPS值来衡量一个服务器的性能。那么如何使用 QPS 与资源利用率转换呢?