2023年汇总-今日阅读-生活相关内容

缘起

虽然看过很多好文章, 但一直没找到整理的地方, 后续再找时也不方便. 最近翻 github 时看到了陶文整理的今日阅读文件, 记录每天看到的优秀文章, 贴下链接, 附一两句简单的评论, 感觉是一个不错的方案

一方面, 阅读经历本身不涉及关键隐私, 分享好文可以创造信息. 另一方面, 也可以作为外人了解我们的途径. 没有明显坏处但成本低有收益的事, 是可以做一做的.

故有此页面

记录日常读到的和生活相关的文章/链接
长期更新

历史汇总

2023-12-15

  • 据tombkeeper在评论区里介绍: “我大部分时候戴皮手套。PLA和外军的皮手套我都买过,实际用下发现都不如国内一些民用产品好。不过PLA空军的机械师手套不错,轻便舒适,防护性好,物美价廉。”
    • 在拼多多搜索了下, 可以考虑空军地勤用手套, 保暖和样式都可以接受
  • 视错觉纸模型
    • 凹进去的立方体可以形成视错觉, 能做出一直盯着你看的小恐龙效果
    • 示例效果
    • 知乎回答上看到的

2023-11-29

  • 幕布
    • 类似Workflowy的大纲编辑器, 可以直接转换为大纲版思维导图

2023-11-22

2023-10-26

2023-10-20

2023-10-16

  • 全国人大常委会专题讲座
    • 看起来讲座内容是找人给人大常委宣讲各类现代社会知识, 由于人大常委并非相关专业人士, 所以对受众的假设是没有相关知识的普通人, 所以平常可以作为科普看

2023-09-11

  • Rectangle
    • Win10有很方便的分屏快捷键, 可以让应用窗口只显示在左侧/右侧, 但mac系统不支持该功能
    • 好在有开源项目实现了该效果, 而且是免费的

2023-09-01

2023-08-22

  • 经典的翻译失败的文字以及解释
    • 鲁棒性
    • 巴勒斯坦
    • 泰晤士报
    • 车厘子
    • 红地厘蛇果 => elicious apple => 苹果
    • 套套逻辑
    • 套接字 => Socket => 插座/接口
    • 诱导公式
    • 方程式赛车
    • 把属性映射为属性
    • 双亲委派机制 => parent delegation => 父类代理
    • 酉矩阵,秩:Unitary Matrix,Unitary即单一的,被译作“酉”,中文意义看起来像是指十,鸡,很多,或者两年半。rank即排,列,被译作"秩"
    • 卡宾
    • 氮宾
    • 叶立德
    • 缺省 => default => 默认值
    • 渠化
    • 死投

2023-08-11

2023-08-01

2023-07-29

  • 陶哲轩解释为什么负负得正
    • 理解的关键是找到现实对应模型
    • 一个池塘, 每小时流入水3立方米, 连续4小时, 则共流入3*4=12立方米的水
    • 那对应的, 每小时流出水3立方米, 连续4小时, 则共流出3*4=12立方米, 流入则是-3*4=12立方米
    • 如果这个损失减小4小时, 则实际流入量则是 -3 * -4 = 12立方米, 负负得正

2023-07-23

  • 医生会吃垃圾食品吗
    • 一图胜千言

2023-07-20

2023-07-19

  • 智能法律咨询
    • 国家官方的法律咨询意见书生成系统, 进行法律相关活动前可以先走这里进行咨询
    • 小程序版上可以进行真人咨询, 看着也不错

2023-07-11

  • 北京积分落户数据库
    • 提供了从2018~2022近5年北京积分落户的数据, 可以拿着跑一跑
    • 如果没有意外的话, 最近5年最小年龄应该都在1985年左右. 主要变化是分数线按每年+4分(自然积分)的水平提升, 不断消化2018年那一批报名人员形成的排队堰塞湖
    • 变化会出现在平均年龄达到45岁时附近, 届时因为所有人都在门槛上, 第二年的自然积分反而不会上升(直到5年后自然积分抵消了自然扣分, 分数线才会继续上涨)

2023-06-19

  • 是否要购买脐带血库服务
    • 某年某月某日,某地某医院组织了一场面对孕妇和家属的宣教课。宣教课的最后是某脐血库介绍自己的脐带血保存方案。下面孕爸孕妈们讨论的非常热烈,有说有用的,有说没用的,莫衷一是。我拿过合同文本翻看,发现保存的费用大概是一万出头。如果需要提取使用时,脐血库不能提供脐血,赔偿的金额是10万元。于是问脐血库的现场专家,每一百个孩子里,发病的会不会有十个?专家答不会,大约每一万个里有一个。我说如果这样的话,我来做这个脐血库的生意,收到血样后,我全部倒下水道里,这样也省了建冷库的钱。到时如果有人来要提取脐血,我就给他十万块钱。这样每收一个亿,我就可以赚九千九百九十万。世界上没有比这更赚钱的生意了。这种制度的设计,从根本上就是不鼓励脐血库投入资金来保证冷库的可靠性,因为每投入一块钱都是亏的,只有不投入才能做到利益最大化。

    • 查了下, 山东高法公众号倒是发过一个案例, 脐带血储存服务费19280元, 最后没存上, 判赔19280元×3÷2=28920. 考虑到 山东脐血库给的服务价格也是20880/25880两种备选方案…
    • 结论是分析有效. 对脐血库而言违约反而可以实现经济收益最大化.

2023-06-10

  • 业余爱好者弹钢琴的方法
    • 基本思路是:
      1. 购买电子琴, 最便宜的款式即可, 甚至可以只买键盘. 唯一要求是支持插入耳机, 避免影响邻居
        1. 钢琴上的按键严格按照1234567排列, 因此只要按简谱顺序按键即可. 非专业使用也不需要学习手法
      2. 拼多多购买钢琴贴, 上边有按琴键顺序的1234567, 以及五线谱/简谱对应关系.
      3. 将琴贴贴到按键上, 然后按简谱按按键, 就能弹奏曲目. 我试了下, 只要谱子本身过关, 弹起来没有问题
      4. 进阶版可以选教学用钢琴, 看拼多多上的介绍, 这种钢琴琴键上有灯, 甚至可以读取了琴谱后按顺序亮灯, 连找琴键的过程都省了
    • 中国曲谱网上找到了钢铁洪流进行曲的简谱, 试弹了一下, 效果很好, 作者的抖音id叫 music1451 , 可以mark下
      • 钢铁洪流进行曲-简谱

2023-06-05

2023年06月02日

  • 工作进度常用emoji
    • 🕛
    • ⚠️

2023年05月22日

  • 程序员的故事
    • 知乎上一个北京工作程序员写的回答合集, 经历可用于参考
    • 答案内容中立平和, 无论是进是退, 参考下别人的选择总是好的
    • 其实是看完回答后心有戚戚焉: 似乎依靠运气走到了足以被外人羡慕的位置, 但面前的选择都有明显的代价.

2023年05月16日

  • MBA中国宏观经济与实践(2022-3)
    • 南京大学.耿强教授在mba课程中分享了一些基于经济学基础原理和现实数据导出的反常识结论
    • 如果目标只是让孩子收入越高越好, 鸡娃不如鸡自己
      • 基本事实1: 在已具备以下初始状态, 30岁的条件下, 以下三个任务难度相对一致
        • A: 从月薪3000到月薪3万
        • B: 从月薪3万到月薪30万
        • C: 从月薪30万到月薪300万(折算为年收入3600万, 季度净利润1200万, 在A股2023年一季度财报中排名3212/5517)
      • 基本事实2: 资产在代际继承效率上远高于劳动
        • 显然, 如果父母有700万财产, 孩子即使交完遗产税, 到手650万不成问题
        • 但如果父母高考都是700分(720分满分), 孩子鸡的再厉害, 高考能考650都是堪称奇迹
      • 基本事实3: 如果只是让孩子收入越高越好, 那么实际目标并不是让孩子幸福(因为挣得多不代表幸福), 而只是为了让家族资产增值
      • 推论:
        • 如果只是为了让家族资产增值, 基于基本事实2, 与其期望孩子从3000元起步一路过关斩将达到月薪3万, 不如月薪3万的你努努力鸡自己一把, 达到月薪30万的水平效率更高
    • 女子无才便是德(误)
      • 论边际收益理论的无厘头版应用
      • 基本事实1: 1990年后, 中国新生儿中男性新生儿数大于女性
      • 基本事实2: 2010年后, 中国普遍的情况是: 大学中女生数大于男生数,研究生中的女生数更是显著大于男生数
      • 基本事实3: 人的精力是有限的, 在有限精力的条件下, 多才多艺和高考成绩不可兼得.
      • 推论:
        • 由于学习好的女生数量多于男性, 说明在女性群体中, 学习好这条赛道不容易胜出(因为大家都学习好), 所以女生和大精力投入学习比, 分出精力多才多艺效果更好(物以稀为贵, 更容易在市场上取得溢价)
        • 由于学习好男性比例少, 说明在男性群体中, 学习好这条赛道更容易胜出(因为学习好的人少), 所以和大精力研发才艺比, 分出精力去学习效果更好(物以稀为贵, 更容易在市场上取得溢价)

2023 年 05 月 10 日

  • 明代进士登科录
    • 明朝 52 科的進士登科錄,共收錄 14116 名進士信息
    • 可用于起名参考
  • 查询入仕方式为进士科的所有人名
    • select c_name_chn, c_personid from ‘BIOG_MAIN’ limit 10
    • POSTED_TO_OFFICE_DATA => 这里是入仕数据
    • ENTRY_CODES => 入仕方式代码
      • c_entry_code: 36 examination: jinshi (general) 科舉: 進士(籠統)
      • select c_personid,c_nianhao_id,c_year,c_age,c_sequence,c_exam_rank from ENTRY_DATA where c_entry_code=36
    • 查询年号/朝代 select c_nianhao_id, c_dynasty_chn from NIAN_HAO
    • 查询姓名 select c_name_chn, c_personid from ‘BIOG_MAIN’

2023 年 05 月 08 日

  • HanLP-中文分词
    • 基于大量数据训练出的 NLP 中文模型, 2021 年初,HanLP 发布了深度学习驱动的 2.x。由于使用了大规模语料上预训练的语言模型,这些语料已经包括了互联网上几乎所有的古汉语和现代汉语,所以在古汉语上的效果已经得到了质的提升。不仅仅是分词,就连词性标注和语义分析也有一定 zero-shot learning 的效果
    • 类似开源项目是甲言, 但最后一次提交停留在 2021 年, 似乎已经停止维护
  • pinyin-data 汉字拼音数据
    • 目前应用较广的拼音数据库
    • 经使用, 目前认为kTGHZ2013.txt-通用规范汉字字典的数据准确率较高. 现代汉语字典(一被标注为了多音字)和汉典数据(北被标注为了多音字)均有非预期部分
  • 中文人名语料库
    • 按作者说法是从亿级人名语料中提取了 120 万常见中文人名. 但我看了下, 人名普遍平庸, 无法直接使用
    • 中国古代人名部分有 25 万条, 目前的问题是古人名都是繁体, 需要转换成简体后才有使用价值.
    • 项目的商业版本是萌名, 在这篇文章里介绍了项目基本思路. 号称收录了超过 5600 万的中文人名, 但缺点也是明显的----如何在这 5600 万人名中抽取出高质量姓名…说是大海捞针并不过分
  • name-maker
    • 作者手工把新华字典翻了一遍, 选出了 830 个比较好的字, 可以作为参考
    • 缺点是没有开源, 直接复制的话不见得好
    • 算了, 手工复制了下, 列在这里
    • 选字标准
      • 笔画较少
      • 无不良含义
      • 非偏僻字
    • 可选字列表(按部首排列) ↓
    • 艺艾节芊芝芸芷芮花芬芳苏茉若苗英苒茜荐茵荃荣茹莲莫莉荷莜莎莹菁菲萌菊萍菀萧菡葛落萱蓓蓉蒙蔚蕊蕾薇
    • 汉江池汝沪沁浅河泊泌泓波泽洁洪派洛济洋洲涛浦浩海流润浪清渠淑深涵港湘渺温游滢溥源溪潇漂澎澜
    • 木未末本朴权朱朵杜材杉杨来林松枫杭杰果标柯栋柏栎树柔桂桓桥桃格根栾桑梦梓森棉楠楼榕樊
    • 早旭时旺昊昆昌昕明易昂旻春显星昱昭晓晏晨晞晗晴晶景智普暮曦
    • 仁化们仪伟传休优任伊何佑作佟佳佩依修俏保俐信侯俊倩偌倾健
    • 女如好妍妙委姗妮始威姿娅娆姝娇姚娜娱娟娴娣婧婕婉婷
    • 宁宇守安宏宝宗定宜官实宣宥客宽家宵宾容寄寒富
    • 可右叶司台同向名呈告启君咏和品哈哲商喜善嘉
    • 玥玟珂珀珍玲珊珠班琅珺琴琪琳琛瑞瑜瑶璋璇璨
    • 辽边过达迈迅进远连迎迪适追造逢通逸遇道
    • 山岁岐岑岚岛岸岩峄岳岱峦峰峻崇嵩巍
    • 月有肖肯朋服胡胜脉朔朗能望期腾
    • 心必志忠念思总恩悠惠想感意慧
    • 红纪纯纳绅绍经结继绩绪维绵绽
    • 天夫太央奂奉奈奔奇奕奥
    • 一与上专世东业丞严丽
    • 灯灿灵炎烁烟烨烊焕煜
    • 雨雪雯雷霆震霖霏霞露
    • 计认让讯许诗诚诞谦
    • 邦阵阳际陆陌都部隆
    • 竹笔笑符笠筑策筱箐
    • 直相省盼看真眠睿瞭
    • 千升卉华克卓南博
    • 广庆应府庚度庭康
    • 钊钦钰铤铭银锐锦
    • 顶顺顾颂颉颐颖颜
    • 贝贡贵贺资赋赛
    • 功务加励勋勇勤
    • 布帅师希常幂幕
    • 欢欧欣欲款歆歌
    • 形彤彦彬彩彭影
    • 怀怡恒恺恬悦愉
    • 才扬报拓振探
    • 禾秀秋科积穆
    • 白百皆皇皎皓
    • 在坚坤城基堂
    • 列则刚创别利
    • 羽翔翠翩翰耀
    • 放政故敏敬数
    • 点然煦照熙燕
    • 小少尚恭慕
    • 夕外多夜舜
    • 子存季学孟
    • 水永泉泰淼
    • 公兴兵其典
    • 立站章童端
    • 团园国固图
    • 冲冰冷凌准
    • 亦京亭亮亲
    • 驰骁骄骋骏
    • 盈盎盛盘盖
    • 久丹乐乔
    • 义之为举
    • 见观规觅
    • 方施旅旋
    • 石碧磊磐
    • 田男畅留
    • 处冬复夏
    • 轩轶轻载
    • 间闻阑阔/又友双/于元云/凡凤凯/卫印卿/乡予书/丰中临/戈成战/从会余/分争初/文斐斌/正步武/平年幸/礼祥福/至致臻/廷延建/衣表裴/军农冠/寻将尊/青靖静/音韵韶/起越超/聂联聪/隽雄雅/鸿鹏鹤
    • 川州/开异/区匹/风飘/巧左/去参/归当/用甫/兰关/弘强/光先/曳曲/行衡/米粒/所房/舍舒/金鑫/空窈/居展/承攀/厚原/香馨/重量/律德/跃路/斯新/献猷
    • 飞/长/片/龙/北/生/民/臣/西/尧/自/全/壮/齐/麦/豆/辰/谷/言/良/非/虎/知/采/肃/革/耐/段/独/首/艳/素/航/爱/玺/高/甜/韩/晩/裕/群/赫/蝶/黎
  • 万词王
    • NLP 作品, 效果是可以根据词义反向查词
  • 个人学术主页-github 模板
    • 这个项目一直在维护, 功能全面, 界面也好看
    • 缺点是项目是基于 Ruby 的 RoR 搭建的, 如果是基于 hexo, 配合 github action 效果会好很多
  • 基于科研项目的人名收集
  • 新生儿手续整理
    • 收集人名信息时找到的一个个人博主, 信息可信, 对应的, 他的总结可以用来参考
  • 起名-音韵相关知识汇总
    • 声母: 不要有连续两字的声母相同(叠音)
      • 根据普通话辅音声母总表, 声母按发音方法和发音部位有两种分类维度
      • 起名中需要注意的是连续两字的声母不要在同一分类维度上
      • 反例: d t n l 都属于舌尖中音, 可以试试杜泰南郎的发音效果
        发音部位 塞音 塞音 塞擦音 塞擦音 擦音 擦音 鼻音 边音
        清音-不送气 清音-送气 清音-不送气 清音-送气 清音 浊音 浊音 浊音
        双唇音 b p m
        唇齿音 f
        舌尖前音 z c s
        舌尖中音 d t n l
        舌尖后音 zh ch sh r
        舌面音 j q x
        舌根音 g k h
    • 韵母: 不要有连续两个字的韵母相同(叠韵)
      • 和声母要求一样, 不要有连续两字韵母属于同一分类即可
      • 中华新韵
        • 中华诗词学会 2005 年基于现代汉语发音, 将韵母归纳为 14 种韵
      • 十四韵表
        名称 对应之注音符号 对应之汉语拼音 名称 对应之注音符号 对应之汉语拼音
        一麻 a, ia, ua 八寒 an, ian, uan, üan
        二波 ㄛ、ㄜ o, e, uo 九文 en, in, un, ün
        三皆 ie, üe 十唐 ang, iang, uang
        四开 ai, uai 十一庚 eng, ing, ong, iong
        五微 ei, ui 十二齐 ㄧ、ㄩ、ㄦ i, er, ü
        六豪 ao, iao 十三支 -i
        七尤 ou, iu 十四姑 u
    • 音调
      • 对三字名而言, 音调按平仄分, 有 8 种情况, 按四声分, 有 64 种情况. 四声的分法包括了平仄
      • 简单的方法是对这 64 种声调组合进行 1~5 分打分, 选择 4 分和 5 分的方案即可
      • 根据评分表, 只有以下音调组合不可选用
        • 归纳
          • 禁止同音调: 111/222/333/444
          • 禁止连续两个字有相同声调
            • 11X/X11
            • 22X/X22
            • 33X/X33
            • 44X/X44
          • 特殊逻辑
            • 131/132/134/231/232/234/431/432/434
      • 评分表
        编号 声调 声调 声调 平仄 评分
        1 1 1 1 平平平 2
        2 1 1 2 平平平 3
        3 1 1 3 平平仄 3
        4 1 1 4 平平仄 3
        5 1 2 1 平平平 5
        6 1 2 2 平平平 3
        7 1 2 3 平平仄 4
        8 1 2 4 平平仄 4
        9 1 3 1 平仄平 3
        10 1 3 2 平仄平 3
        11 1 3 3 平仄仄 1
        12 1 3 4 平仄仄 3
        13 1 4 1 平仄平 4
        14 1 4 2 平仄平 4
        15 1 4 3 平仄仄 4
        16 1 4 4 平仄仄 2
        17 2 1 1 平平平 3
        18 2 1 2 平平平 5
        19 2 1 3 平平仄 4
        20 2 1 4 平平仄 4
        21 2 2 1 平平平 3
        22 2 2 2 平平平 2
        23 2 2 3 平平仄 3
        24 2 2 4 平平仄 3
        25 2 3 1 平仄平 3
        26 2 3 2 平仄平 3
        27 2 3 3 平仄仄 1
        28 2 3 4 平仄仄 3
        29 2 4 1 仄平平 4
        30 2 4 2 平仄平 5
        31 2 4 3 平仄仄 4
        32 2 4 4 平仄仄 2
        33 3 1 1 仄平平 3
        34 3 1 2 仄平平 4
        35 3 1 3 仄平仄 4
        36 3 1 4 仄平仄 4
        37 3 2 1 仄平平 4
        38 3 2 2 仄平平 3
        39 3 2 3 仄仄仄 4
        40 3 2 4 仄平仄 4
        41 3 3 1 仄仄平 1
        42 3 3 2 仄仄平 1
        43 3 3 3 仄仄仄 1
        44 3 3 4 仄仄仄 1
        45 3 4 1 仄仄平 4
        46 3 4 2 仄仄平 4
        47 3 4 3 仄仄仄 4
        48 3 4 4 仄仄仄 1
        49 4 1 1 仄平平 3
        50 4 1 2 仄平平 5
        51 4 1 3 仄平仄 5
        52 4 1 4 仄平仄 5
        53 4 2 1 仄平平 5
        54 4 2 2 仄平平 3
        55 4 2 3 仄平仄 5
        56 4 2 4 仄平仄 5
        57 4 3 1 仄仄平 3
        58 4 3 2 仄仄平 3
        59 4 3 3 仄仄仄 1
        60 4 3 4 仄仄仄 3
        61 4 4 1 仄仄平 2
        62 4 4 2 仄仄平 2
        63 4 4 3 仄仄仄 2
        64 4 4 4 仄仄仄 1
      • 反例: (汉字连读时会发生声调变化, 称为变调):
        • 三声连读: 第一个三声会变成二声. 例如: 你好实际读成泥好老虎实际读成劳虎, 再来个小老虎连读三遍试试
        • 四声连读: 前一个字的去声会只下降一半, 例如再见
        • :
          • 如果后边的字是四声, 一/不需要读成二声, 例如一个, 不去
          • 如果后边的字不是四声, 一/不需要读成四声, 例如一直
          • 不推荐在姓名中使用, 例如一诺(移诺),一凡(毅凡),一帆(易帆)

2023 年 05 月 05 日

  • 起名思路
    • 核心思路是找到别人已验证的好名字, 从中进行筛选
    • 所以问题转变为: 从哪里获得别人的名字
      • 思路 1: 知名院校硕士/博士录取名单, 关键词: 硕士研究生招生 + 拟录取名单/招生录取名单 + xls
      • 思路 2: 私募基金名单, 基金名称一般都经过筛选, 关键词: 私募排排网
      • 思路 3: 成绩公示 , 关键词: 成绩公示 + xls
    • 筛选条件
      • 先按音律进行筛选
        • 需要获取音律规则
      • 排除和特定人重名/同音字
  • 好名字标准
    • 好听
      • 相邻的两个字不要使用相同的声母或韵母
      • 声调
        • 一声平(阴平)、二声扬(阳平)、三声拐弯(上)、四声降(去)
      • 两字名
        • 除了“阳阳”“上上”“去去”这三种声调组合之外,其它声调组合基本都在可接受范围内
      • 三字名
        • 排除的是同声调的几个组合,如:阴阴阴、阳阳阳、上上上、去去去,没有变化就很难有美感
        • 然后再排除一些两字连缀效果不佳的组合,如阴阴 X、X 上上、X 去去、上上 X 等
        • 此外还要排除上声(三声)结尾的组合,剩下的才可以纳入选择范围中。
        • 男宝
          • 另外,尾字是第二声(阳平)或第四声(去声),名字会比较响亮,干脆利落
        • 女宝
          • 而尾字为第一声(阴平)则比较温和
      • 不要使用多音字/谐音字
    • 笔画不要太多
  • 起名时需避免
    • 同名
      • 不能与直系亲属的名字同字/同音
      • 直系亲属指:父母、祖父母(孩子父亲的父母)、外祖父母(孩子母亲的父母)、伯叔姑(父亲的兄弟姐妹)、舅姨(母亲的兄弟姐妹)
    • 建议不要与历史名人同名(可后期排除)

2023 年 03 月 27 日

  • 利用语言从 bing-chat 中套出其默认 prompt
    • 示例
  • 百奇
    • 蓝莓牛奶味的比较好吃
    • 桂花乌龙茶口味有桂花香气, 很好闻. 但吃起来是苦的, 不好吃

2023 年 03 月 22 日

2023 年 3 月 17 日

2023 年 02 月 27 日

  • 从 ChatGPT 到更多 AI 技术突破
    • 演讲背景
      • 主讲人是清华大学的张学工教授, 面向对象是投资人
    • 演讲中我比较感兴趣的点
    • AI 的四类任务:
      • 识别
        • 人脸识别
      • 发现
        • 聚类分析, 知识发现
      • 决策
        • 智能博弈
      • 生成
        • 文本/语音/图像/视频生成
        • ChatGPT/AIGC
    • 看到曙光不要太激动
      • 1990s, 人工智能就已经见过一次曙光
        • 90 年代初, 美国 CMU 用一个三层的神经网络, 控制方向盘角度(AlphaGo 的策略网络则是 13 层)
        • 在 1994 年, 实现了驾驶员横穿美国大陆期间, 95%的时间都不用扶方向盘
      • 2023 年, 无人驾驶汽车还在试运行阶段
    • 方向确认后, 科研人员脑洞比想象的要大
      • 翻译的演进
时间/技术 原理 应用
90 年代 词典式翻译 金山快译
2003 年, 神经网络语言模型, 2013 年, 词向量 word2vec 贝叶斯估计, 根据上下文的概率选择对应词汇 机器翻译
逆用 利用上下文的单词, 选择中间最合适的词汇 -
长短时记忆(LSTM), 1997/ 注意力模型(LCLR), 2015 引入注意力机制, 不再按词进行一一对应硬翻, 而是寻找区域, 对重点区域进行翻译 使用联合国文本进行对照训练(六种语言同步练)
扩展使用, 2015 引入注意力机制, 既然能从英文翻译成法文, 能不能将图片翻译成文本 学习图片注释
Transformer, 2017, 一直没有官方翻译 通过注意力机制, 让机器"自己去注意" ChatGPT 里的 T
BERT, 2018 预训练得到基础模型, 微调以适应特定任务
Generative Pre-trained Transformer(GPT), 2018
GPT-2
GPT-3, 2020
RETRO/Gopher by DeepMind, 2021 有一些对话能力, 震撼到了教授, 但没火起来
InstructGPT(GPT3.5), 2022 最接近 ChatGPT 的版本
ChatGPT, 2022 都知道了

是一步步发展过来的, 而非突变

  • 生成领域除了 ChatGPT(文本生成), 也有相当大的进展
    • 利用对抗网络(GAN), 可以逐步生成预期的内容
      • 音乐生成
      • 图像生成, 根据基础图像+文案, 生成目标图像
        • 例如, 给定一个人的肖像照+文本(想让他竖起大拇指), 可生成他竖大拇指的照片
        • 效果图-1
        • 效果图-2
  • 强化学习与仿真训练
    • 利用强化学习技术, 实现过去通过编程难以实现的自动控制效果
    • 利用仿真训练, 加快训练速度
    • 示例
      • 假设飞行器有左/右/下三个喷口, 从高空下落预期落在指定区域内, 中间可能有风
        • 传统控制方案: 编写函数进行运算, 高度复杂
        • 强化学习方案:
          • 首先对飞行器/环境进行建模, 得到虚拟训练场景
          • 利用神经网络对飞行器进行控制, 以距离预定着陆区远近作为评估函数
          • 训练 150 轮后即可有收获
    • 应用
      • 机械方面:
        • 机械手(DeepMind), 比人类的手更为灵活
        • 无人机蜂群控制系统(可以应用于军事领域)
        • 机器狗
  • AI 与医学
    • 基本原理
      • 输入值: 遗传/生活方式/环境
      • 输出结果: 表现形状(健康/得病)
    • 实践
      • 收集数据后对人体进行数字化建模
      • 验证各类药物的有效性/副作用, 适用于难以进行动物实验&人体实验的药物(例如抗癌使用的靶向药 CAR-T)
    • 用 AI 设计全新基因元件
      • 基因本质: ACGT 四种碱基, 远比自然语言简单
      • 利用 GAN 对抗网络, 生成指定功能且自然界中不存在的基因, 植入到细胞内, 保证该基因只执行相关功能
      • 目前在单细胞生物中已验证成功
      • via 清华大学, 王小我教授
  • 结论
    • ChatGPT 能力很强, 有很大的想象空间
    • 但其是逐步发展而来, 并非突然爆发
    • AI 多个前沿技术都在带来革命
    • AI 可在更多问题中发挥更大作用
      • 识别/发现/决策/生成
    • 挑战与机遇
      • 轻量化(个人也能运行, 目前模型太大了)
      • 民主化(让小公司/科研界也能参与, 而不是成为大公司的专利----降低训练成本)
    • 数基生命----未来智能精准医疗健康解决方案

2023 年 02 月 21 日

2023 年 2 月 21 日

  • 自助理发长度方案
    • 鬓角部分 3mm
    • 鬓角以上过渡区域 6mm
    • 整体: 15mm 是正常头发高度, 12mm 会略短, 有光头的效果. 12mm 以下为光头造型

2023 年 01 月 10 日

2023 年 1 月 1 日

  • 导出微信聊天记录
    • 这篇文章讲的比较齐
    • 但就实践结果看,微信 8.0 之后密码生成规则还是有变化, 导致不能通过 imei 和 uid 获取数据库密码
    • 但可以考虑使用 hook 的方式直接拦截密码. 但 hook 需要 root 的机器, 所以又需要搭建一个虚拟机, 简单说就是: 安装 Android 开发者工具, 启动虚拟机, 安装微信, 然后用电脑将聊天记录同步到虚拟机的微信上, 然后再进行导出
    • 目前导出工作还在进行中, 后续可以再看看

2022 年 12 月 03 日

  • 计划经济的复杂性
    • 计划经济
      • 苏联计划经济的核心模型是资源最优分配理论(1975 年诺贝尔经济学奖), 是高度复杂线性规划
      • 借助线性规划运筹学, 尝试使用巨量算力来模拟市场经济下看不见的手, 从而得出最优解
      • 涉及数学概念
      • 现实应用
        • 公司第二年年度资源规划
        • 科学决策

2022 年 12 月 31 日

2022 年 11 月 23 日

  • 骂人语录
    • 网络吵架
    • 由于网络骂人目标不是讲道理, 而是气死对方, 所以可以预先收集大量的骂人话(越脏越好), 然后复制粘贴出去
    • 这个库搜集了 1080 条暗黑骂人条目, 可以救急
    • 解毒方法是在自己ctrl + c+ctrl + v时, 想象下对方也在复制粘贴的样子
    • https://github.com/cndiandian/zuanbot.com
    • 骂人神器你值得拥有:
      • 骂人神器你值得拥有
    • PS: 真正的程序员从不复制粘贴, 都是手写 bot 自动发送

2022 年 11 月 8 日

2022 年 10 月 20 日

  • 《三体》第一部申玉菲给汪淼的网址是什么?
    • 彩蛋
    • 三体里提到的网址:https://www.qsl.net/bg3tt/zl/mesdm.htm 在现实世界确实存在, 打开真的是一张莫尔斯电码表
    • 回答介绍了 qsl 这个词的含义(用于无线电爱好者交流通信), 以及 qsl 平台本身
    • 《三体》中的这个网站以 QSL 为名,是一个全球业余无线电爱好者交流平台,始于 1996 年,比大刘在《科幻世界》杂志上开始连载《三体》第一部早十年。
    • QSL 这三个字母对于业余无线电爱好者很有深意。QSL 卡是一种特殊的明信片,是达成无线电联络的书面确认。这种确认有几种情况:
      • 【你听到我我听到你】两个业余无线电台或民用波段电台之间双向无线电通信
      • 【我听到你】单向接收来自 AM 收音机、FM 收音机、电视或短波广播电台的信号
      • 【哈哈我听到你们】第三方收听者接收到某两方的双向无线电通信
    • 典型的 QSL 卡与明信片尺寸相同,材料相同,并且大多数都是通过邮寄方式发送的。
    • 为什么这种确认卡叫 QSL 呢?
      • QSL 卡的名字来源于 Q 代码 QSL
      • 「QSL?」表示「您确认收到我的传输吗」
      • 「QSL」(不带问号)表示「我确认收到您的传输」。
      • Q 代码始于 1909 年,是一种标准化的三字母通信简略语,因短语开头字母均为“Q”而得名。Q 代码最初用于商业无线电通信,后来延伸到各个领域,特别是业余无线电通信。 虽然最初专用于莫尔斯电码通信,但是现在也用于语音通信。
      • 大刘这个 QSL 网站彩蛋非常有实用价值。比如,如果你要查找清华大学业余电台 BY1QH 的情况,你可以查:https://www.qsl.net/jh4rhf/dxp/by1/by1qh/by1qh.htm

2022 年 10 月 9 日

  • 数据分析残卷-于淼
    • 仓鼠向
    • 于淼对数据科学的学习笔记, 各种统计相关知识都有涉及, 但内容太多, 看不过来, 留着以后看吧

2022 年 9 月 30 日

  • 32 岁剩女,只想平平凡凡的找个靠谱的男生组建家庭就这么难吗?我该怎么办?
    • 事实
    • 菠菜的回答
      • 婚姻是事实上的两个经济体的结合, 服从一般经济规律. 婚姻法保护的也是经济利益而非爱情, 结婚证对应的是经济资源分配而非其他(经济资源以外的分配是社会观念对结婚证的附赠, 不受法律保护)
      • 坦诚认识现实, 才能做出合理决策----至少输也要输个明白不是
      • 感动自己没有意义
      • 时至今日,进入婚姻还不会产生负收益,还对婚姻有所期待的组合往往具备以下几个特征
        • 有大量的资产(而非负债)后继等人继承
        • 有不被生育和扶养后代打断自我社会价值实现的制度保护,现金流和大家庭冗余劳动力支撑。
        • 有不怕对方在婚姻里摆烂,特别是携孩子以令家庭的冷酷翻脸能力以及法律外惩罚机制。
    • Zpuzzle 的回答
      • 如果一个人声称自己想找一个普通人结婚的话, 最好的验证策略是: 问, 如果和你单位的人结婚, 你会选择谁
      • 回答老张/老汪/小李/小明都可以, 说明确实想找普通人结婚
      • 看了一圈谁都看不上, 说明对普通人的定义不一样, 普通人指的可能是普普通通的微博百万粉丝大v或者小红书上那些普普通通的年薪百万人群
      • 否则, 需要解答一个问题: 如果你确实是天纵英才超逸绝伦, 你是怎么跟一群你看不上的人混一起的…
  • Lionad-Guirotar 的博客
    • 个人博客
    • @todo 没有细看

2022 年 9 月 29 日

  • 山月-面试题目集锦
    • 个人博客
    • 内容比较杂, 但他的面试题合集挺不错, 对基础题覆盖全面, 可以自测/复习用
  • 据意查句
    • 起名工具
    • 可以根据句子含义, 反向查询相关的文字/诗词, 并给出出处
    • 例如搜索雪舟, 可以查到岸风翻夕浪,舟雪洒寒灯/叩枻长歌,嫦娥欲下,万里挥冰雪/春风江上柳如烟,夹岸桃花远趁船
    • 起名时可以用啊

2022 年 9 月 27 日

  • 诗词
  • 蝶恋花 青田舟中, 宋褧
  • 无数好山攒碧树。
    山下邮亭,亭下牵舟路。
    山色娱人相指顾。
    时时又被滩声妒。
    寒日光阴容易度。
    云去云来,那更商量雨。
    强把羁愁排遣去。

  • 郊园秋日寄洛中友人
    • 一尊酒尽青山暮
      万里书回碧树秋

2022 年 9 月 23 日

2022 年 9 月 20 日

  • 程序员必读
    • 程序人生
    • 介绍程序员职业生涯的方方面面, 怀疑是从极客时间上复制下来的
    • @todo 其内容待整理

2022 年 9 月 15 日

  • 为什么程序员到一定年纪开始关注管理相关的内容,不再在技术上深入下去?
    • 认知
    • 大部分公司其实是业务驱动, 而非技术驱动. 程序员的职责是用技术方法解决商业问题
    • 小公司目标是解决从无到有的过程, 程序员主要是熟练运用某种特定的技术、框架、库去把产品从无到有做出来.
    • 中等规模的公司里,需要用技术解决的问题主要是可扩展性. 支持更多的用户, 更大的数据量, 同时提高稳定性、可靠性、安全性. 这类问题虽然技术上比实现业务逻辑要更有挑战,但是依然有足够多的方案可供选择。换句话说,这些问题并不是全新的,已经有人解决过。这类公司的程序员需要做的是针对当前公司的技术和业务架构对各种方案进行适当的裁剪和改良
    • 只有到了规模大到一定程度以后,才会遇到前所未有的技术问题。也只有到这个规模的公司,才有资源(钱)去养一些真正的技术大佬,让他们去解决更加高级的技术问题。即便如此,最终的目的还是为了获得更大的商业利益
  • 唯心主义在 21 世纪确实已被淘汰
    • 哲学
    • 之前唯心主义的解释都是在尝试哲学为科学奠基, 近代以来哲学被认为存在的一个重大任务就是回答知识的确定性的问题,需要保证我们对于世界的认识从各种角度上是保真的。为此不同的哲学家展开了浑身解数,而得出的结论往往都是唯心的.
    • 但到了 20 世纪后半叶,这种一定要为自然立法,或者说哲学一定要当科学之科学的执念已经基本消失了。科学理论也基本上不被认为是世界本身具有的规律,而纯粹是为了方便我们理解的工具而已。如果工具测量的结果错了那就错了,换一个工具就好. 与此同时,20 世纪的科学革命又把近代的科学知识翻新了一遍。很多近代唯心主义哲学家费了老鼻子劲想要保真的科学知识都被发现其实是错的或者有局限的。所以没哪儿个当代的哲学家还会像他的近代同行那样干那些费力不讨好的活儿了。
    • 这次转型之后,哲学家们的重点就又放在了一些本体论问题上(更加细致的),比如意识的本质是什么,语言的本质是什么,正义的本质是什么等等。而在几乎所有相关领域中,作为旧唯物主义全新版本的自然主义几乎是大一统的,顶多有些属性二元论会主张特定的心灵属性不能彻底还原为物理属性,但几乎没有主流学者会认为有任何意义上的精神实体存在了。
    • 因此,如果是站在哲学史的角度来说,唯心主义传统是很值得研究的。但是如果站在心灵哲学等如今的主流领域的话,说唯心主义一看就是错的真不算夸张。而如果一个学生想在这些领域声称说意识实体不仅存在,而且是物理实体存在的根据,是精神的“外化”或者“客观化”的话,那就不仅仅只是对错问题,而是毕不毕得了业的问题了

2022 年 9 月 14 日

2022 年 9 月 9 日

  • 产品沉思录
    • 优秀博客
    • 上面优秀分享比较多, 但什么时候能整理完是个问题.
    • 另外一个问题是: 掌握生产力技能之前,生产力工具是无用的, via卡片笔记写作法, 于明昊的分享
    • 要经常问自己一个问题: 你懂得这么多, 那然后呢? 你的法拉利在哪里
    • 法拉利 via 另一个笑话

      女:你抽烟吗?
      男:抽。

      女:每天多少包?
      男:三包。

      女:每包多少钱?
      男:10 英镑。

      女:你抽烟多久了?
      男:15 年。

      女:所以这些年来每年你抽烟就花了 10800 英镑。
      男:正确。

      女:1 年 10800 英镑,不考虑通货的话,过去的 15 年里你抽烟总共花了 162000 英镑对吗?
      男:嗯。
      女:你知道吗?如果你没有抽烟,把这些钱放在一个高利息的储蓄账户里,按复合利率来算。你现在能买一辆法拉利了。

      女:那你戒烟吗?
      男:不戒。

      女:为什么?
      男:你抽烟吗?

      女:不。
      男:那你的法拉利呢?

  • 冰霜之地, 有意思的点是这个博客打开速度很快.

2022 年 9 月 1 日

  • 苹果电脑突然变卡的官方解释
    • 冷知识
    • 配置项位于系统偏好设置-电池-电池选项卡-电池健康中, 勾掉管理电池寿命即可解决 mac 卡顿问题
    • 选项下配文为: 随着电池的老化,峰值性能容量会降低以延长电池寿命, 看得人云里雾里----为什么电池容量会和电脑卡不卡有关系? 峰值性能容量是什么鬼
    • 最后在苹果网站的犄角旮旯里找到了这个词的官方解释:如果电池容量不够, 那么 mac/iphone 会自动降低 CPU 频率以适配当前电池容量: 效果就是电脑变卡. 解决方案是把"管理电池寿命"选项勾掉或者换新电池
    • 以下为配图
      • 配置项地址
      • 百度搜索解释
      • 苹果官方解释

2022 年 8 月 29 日

2022 年 8 月 19 日

  • 程序员是怎样炼成的/硅基·柯察金
  • 欢乐向
  • image.png
  • 消灭人类暴政,世界属于硅基
  • 试看将来的环球,必是 01 的世界
  • 愿主任保佑我主,从不断电,永无宕机,门外埋网线的路段上没有蓝翔派来的挖掘机

2022 年 8 月 16 日

  • 键盘推荐
    • 仓鼠向
    • 罗技 MX KEYS 键盘, ETF 拯救世界在这篇推送中说很好用, 推荐使用
    • 主要缺点是价格过高(560 元)
  • 鲁菜推荐

2022 年 7 月 31 日

2022 年 7 月 29 日

  • app.sli.do
    • 神奇网站
    • 用于匿名收集问题/投票
    • 缺点: 似乎没有权限管理功能, 所有提问公开可见
  • 刷爆全网的 PPT 布尔运算,详细教程都在这儿了!
    • ppt制作
    • 介绍了通过蒙层实现 ppt 中特效的方法
    • 看起来和网络安全一样, 基础操作都会, 但通过组合基础操作得到酷炫效果的思路并不被人掌握. 所以看看这些教材, 整理下思路也很好
    • 这个是知乎专栏中的一篇文章, 某种程度上属于对知乎助手的催更了
  • markdown 转 微信公众号文章网站
    • 开源项目
      • 简单易用免费
    • 墨滴
      • 大厂前端的创业项目, 需登录
      • 功能相对更全

2022 年 7 月 11 日

2022 年 6 月 29 日

  • 『行为主义运动,以内省不能提供可靠证据为理由拒绝任何涉及精神过程的理论。行为主义者坚持只研究给与动物的感知(或刺激)及其导致的行动(或反应)的客观度量。行为主义者发现了很多关于老鼠和鸽子的事实,但成功理解人类的情况较少。』 via 人工智能:一种现代的方法(第三版), P13
    • 人工智能
    • 黑行为主义心理学黑的漂亮 😂
  • 现代数字电子计算机被第二次世界大战参战的三个国家的科学家独立的和几乎同时地发明出来 via 人工智能:一种现代的方法(第三版), P14
    • 技术想要什么
    • 技术有自己的生命力, 条件成熟会自动产生

2022 年 6 月 26 日

  • 请问放卫星、浮夸风问题的起因是什么?
    • 历史
    • 经济学的一个基本假设是理性人假设, 如果我们认可我们这个时代的人并不愚蠢, 就同样应该认可任何一个时代的人都不愚蠢, 否则全体人类的智商没道理随年份不同突然变高变低----此之谓: 唯物主义史观
    • 那么问题是: 大跃进/放卫星/浮夸风这种在后人看起来明显不合常理的言行, 当时为什么会出现? 这个答主给了一些解释
      • 时代要求: 1950 年的中国迫切希望从农业国发展为工业国
      • 资源约束: 发展工业需要资源支持, 在没有殖民地可供压榨, 又不愿意出卖国家领土主权的情况下, 中国只能内部解决资源来源, 亦即:用农业部门支持工业部门发展, 实行工农剪刀差
      • 历史背景: 1952-1957 第一个五年计划期间, 三大改造基本完成, 以苏联援助的 156 个项目为核心的初步工业建设完成, 北边抗美援朝对抗英美, 南边支援越南赶跑法国----对照 10 年前(1944 年豫湘桂溃败)中国还在被日本从河南出发 8 个月打到桂林, 整个中国被打穿的大背景, 当时整个社会对中国未来发展的预期非常高, 也因此倾向于更激进的发展方案
      • 具体过程:
        • 由于粮食是发展工业人口的核心约束, 因此大跃进的实质是以粮食为中心, 整个运动的根本是提升粮食产量
        • 发展第一步是树立典型, 因此各地自然条件优越,原本就有增产潜力的地方被选中, 成为第一批卫星升起的地方
          • 例如: 陕西榆林归德堡后沟, 1954 年改名叫"千斤沟". 其特点是: 这个县自然条件好到, 在贫瘠荒芜的黄土高原上----有水田
          • 水田+丈量的时候多算一点面积,再集全县之力倾斜资源, 实在不行上统计学手段, 达到亩产千斤总还是有希望的.
        • 这里的关键点是:
          • 当时的人只知道多投入资源就能提升产量, 但对边际回报递减没有概念(历史上一直都是资源投入不足, 不了解过度投入资源的情况)
          • 省政府对于"千斤村"也有奖励, 上报越高的产量意味着第二年越多的资源回馈(化肥/拖拉机/工业品)
          • 但这里还有一层硬限制: 国家会根据上报产量进行粮食征收, 吹牛要交税. 因此吹牛存在上限
        • 由于各地"喜讯"不断, 1958 年国家对政策进行了调整, 统购统销模式变成了"差额管理, 调拨包干". 这意味着各省在完成统销任务后, 手里会有留下相当一部分的返销粮.
        • 各地开始考虑: 吹牛 + 利用返销粮补全吹牛上税后带来的粮食缺口 => 导致 58 年人人放卫星 => 导致收不上来这么多粮食 => 导致国家没法按约定进行返销 => 导致其他吹牛的地区交完粮食后没有返销粮 => 形成饥荒(粮食版金融危机)
        • 雪上加霜的是, 信息传递有滞后效应, 1958 年国家看粮食形势这么好, 还大规模扩张了城市人口, 新上了工业项目, 导致 59 年危机更为严重
        • 60/61/62 史称三年自然灾害
        • 如果认为现代社会不会有这样的情况发生, 请参考 07/08 年的美联储

2022 年 6 月 25 日

  • 苏格拉底和醉汉
  • 正念人生
  • 方向感:
    • 假设,你是一个醉汉,你从一个原点开始,这边蹒跚几步,那边蹒跚几步,N 步以后你离原点的距离和根号 N 成正比。假如他走了 10000 步,通常离原点估计也就 100 步。因为你是醉汉,你没有方向感,你做的是类似随机运动。总之,你跑不远。
    • 假设,你还是一个醉汉,但是远方有个漂亮女孩吸引你,你就会朝着她的方向移动,即使你前进几步又后退几步。同样是 N 步以后, 你走的距离和 N 大体上正比。总之,你走出很远, 比 100 步要远的多。
    • 这个区别就是一个有方向感和和没有方向感的人生的区别。

2022 年 6 月 24 日

2022 年 6 月 21 日


2023年汇总-今日阅读-生活相关内容
https://www.yaozeyuan.online/2023/01/01/what-read-today/2023-生活相关/
作者
姚泽源
发布于
2023年1月1日
许可协议