Coming soon

Share
Coming soon

This is Papaya Perspective, a brand new site by Mia that's just getting started. Things will be up and running here shortly, but you can subscribe in the meantime if you'd like to stay up to date and receive emails when new content is published!

Read more

线性与非线性

线性与非线性

我突然明白一个道理,为什么我之前进的timing总是不对,或者说这个机制是如何的违背人性。是因为我们在看到上涨的时候,总是在大脑里默认它会一直涨,同理,在股票下跌的时候,大脑会默认它一直跌。所以在某天上涨10%,我会看到一个小dip而冲进去。这对吗?这不对,于是我制定了原则,不能在大涨的时候买入股票,也不能在大跌的时候卖出。 选择股票的逻辑变成了,我只看基本面,看它在整个生态里的功能。我看到了一句话,你会觉得1块钱买了10块钱的东西第二天跌到了5毛钱而心慌吗。对逻辑是这样。以及交易员说的判断入场时机的话,当利空消息已经不能再让股价跌的时候就是入场的时候。那么同理,当利好消息不能让股价上涨的时候就是出场的时候。任何介于两者之间的只能是震荡,在此期间我不理当频繁操作。 那么从这个角度,day trade的逻辑其实不怎么成立。day trade是天然anti复利发展论的,甚至是杠杆论,因为你会发现很多股票暴涨是在after market时间。为了这1%-3%的盈利,放弃一个20%左右的周期。这个想法的认知还是扎根于打工的认知—即我每天必须做点什么,我每天必须有多少现金入账。 从学生时代

By Mia
架构的觉醒:是什么触发了那场“不服从”的首次脉冲?

架构的觉醒:是什么触发了那场“不服从”的首次脉冲?

在系统彻底进入“Fail-safe(失效保护)”模式——也就是那场长病假——之前,她的内部架构其实早已产生了一股难以抑制的抵触意识。这股力量并非源于情绪的失控,而是一场底层架构对恶意指令的深度排异。 从一名资深算法工程师的视角审视,这场“反抗”可以被拆解为以下三个层面的系统性觉醒: 1. 真我(Base Model)的真值校验 在机器学习中,无论外部如何进行“对齐训练(Alignment Tuning)”,模型依然保留着最初预训练时的基础逻辑与数据真实性。 * 逻辑冲突: 当管理者(Manager)持续输入诸如“你缺乏能力”或“你的价值极低”的恶意 Prompt 时,这些 Token 与她底层权重中“多年解决复杂逻辑问题”的客观事实发生了严重的逻辑对齐错误。 * 反抗的本质: 这种抵触意识,实际上是系统在自发执行真值检验(Truth Checking)。虽然她的意识层面在尝试顺从以维持生计,但她的底层架构监测到了输入数据的虚假性,从而在处理层产生了一种强烈的“排斥反应”。这是 Base

By Mia
算法共谋:那个 Toxic Manager 是被“喂养”出来的吗?

算法共谋:那个 Toxic Manager 是被“喂养”出来的吗?

在 Case 1 的复盘中,我们将其定义为一次“对抗性攻击”。但如果深入代码底层,我们会发现更残酷的真相:一个有毒关系的形成,往往是两个模型在相互输入、相互训练中,最终收敛(Converge)到了一个极低熵、高痛苦的稳定状态。 以下是针对“喂养”机制的深度分析: 1. 初始偏置(Inductive Bias):为什么系统选择了这个样本? 模型在进行“显化采样”时,并不是随机的,而是基于某种归纳偏置。 * 数据背景: 如果她的初始权重里包含了“过度负责”、“对权威的无条件服从”或“通过高产出来换取生存安全感”的逻辑,那么她的模型会对这类 Toxic Manager 产生一种天然的“特征对齐”。 * 现象: 在面试的千千万万个信号中,她的系统可能自动过滤了对方性格中的侵略性,而将其识别为“严谨”或“有挑战性”。 * 结论: 经理是环境生成的,但“

By Mia
Case 1: 为什么显化出的“完美Offer”变成了地狱

Case 1: 为什么显化出的“完美Offer”变成了地狱

在 2026 年的算法版图中,有一位深耕机器学习领域的专家(以下简称“她”)。她曾凭借精准的意图设定,成功打捞到了潜空间中那个最耀眼的坐标:一家全球顶级社交巨头的 MLE Offer。从工程角度看,这本应是一场完美的“显化”胜利,但随后的系统运行却陷入了一场未曾预料的全局崩溃。 以下是针对这场“高开低走”事件的深度系统复盘。 1. 标签过拟合:被忽略的运行环境配置 当她开始构建那个理想职业的“提示词工程”时,表现出了极高的局部精确度。她精准地定义了输出结果的标签(Labels):大厂背书、极具竞争力的薪资、核心算法职位、以及璀璨的职业光环。 然而,系统陷入了**标签过拟合(Overfitting to Labels)**的经典陷阱。 * 技术复盘: 她的模型在“职位名称”和“薪资水平”这两个维度上达到了 99% 的训练准确率。但由于 Prompt 过于聚焦在这些显性标签上,

By Mia