(原标题:市场震荡调整!农业股集体走强 基建股表现活跃)
今天,A股、港股都陷入了震荡调整,一起看看发生了什么。
小幅震荡调整
2月24日,A股市场全天震荡调整,创业板指领跌。截至收盘,沪指跌0.18%,深成指跌0.08%,创业板指跌0.67%。
市场共2778只个股上涨,91只个股涨停,2468只个股下跌。
农业股集体走强,智慧农业、星光农机、东方集团涨停。消息面上,2025年中央一号文件2月23日发布,本次中央一号文件首提“农业新质生产力”。
基建股表现活跃,北方国际、中工国际、北新路桥等涨停。
DeepSeek概念股震荡调整,航锦科技、浙文互联跌停,每日互动、青云科技跌超10%。
港股方面,恒生科技指数跌约0.8%。
消息面上,美东时间2月21日,白宫网站发布“美国第一”投资政策备忘录,宣布将调整美投资政策,重点进一步限制与中国的双向投资。我国商务部表示,在中国赴美投资方面,美针对中国投资加严安全审查,将严重打击中国企业对美投资信心。希望美方为中国企业赴美投资提供公平、透明、稳定、可预期的营商环境。在美对华投资方面,美方将进一步采取更多限制措施,这是非常不合理的。有关措施一旦落地,会进一步扭曲两国投资往来,对美自身也没有好处。很多美国商协会和企业已经提出,美对华投资限制将导致美国企业将中国市场让给其他竞争对手。
DeepSeek今日启动开源周
首个开源代码库为FlashMLA
2月24日,DeepSeek启动“开源周”,首个开源的代码库为FlashMLA——针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计。据介绍,FlashMLA的灵感来自FlashAttention 2&3和cutlass项目。
其发布有以下几个重点内容:
FlashMLA是DeepSeek针对HopperGPU优化的高效型MLA(Multi-HeadLatentAttention,多头潜在注意力)解码内核,专为处理可变长度序列设计,已在生产环境中投入使用。
此项目是DeepSeek V2–V3系列大模型的重要技术创新,旨在通过优化解码过程和KV缓存来降低大语言模型的推理成本,同时提升响应速度和吞吐量。
FlashMLA在英伟达H800 SXM5 GPU上测试时,能够达到3000GB/s的内存带宽和580TFLOPS的计算上限,这显示出在内存访问和计算效率上的显著优势。
目前发布的版本支持BF16精度,并采用块大小为64的分页KV缓存,确保在处理大模型推理任务时更加高效。
官方指出,FlashMLA的设计灵感部分来源于FlashAttention2&3以及英伟达的CUTLASS项目,这表明该解码核在高效注意力计算方面进行了针对性优化。
通过采用低秩分解等技术,FlashMLA在压缩KVCache的同时仍保证了原有性能,能够在降低内存需求的同时提升推理效率。
FlashMLA特别适用于需要处理长序列文本的应用,如聊天机器人、文档分析以及实时翻译系统,能显著降低延迟和资源占用。
随着该项目开源,未来有望集成到vLLM、Hugging Face Transformers或Llama.cpp等开源生态系统中,使得更多大语言模型(如LLaMA、Mistral、Falcon)能在相同硬件资源下获得更高效的推理性能。
发布的代码中包含内联PTX代码,这种做法使得开发者可以更精细地控制GPU执行流程,进一步提升计算性能,并可能部分绕开英伟达封闭生态的限制。
上周四,DeepSeek宣布在这周举办“开源周”活动,并开源五个代码库。
DeepSeek表示以完全透明的方式与全球开发者社区分享他们的研究进展,每日都有新内容解锁,进一步分享新的进展,并将这一计划定义为“Open Source Week”。DeepSeek表示,其在线服务中的构建模块已经被记录、部署并进行了实际测试,希望分享的每一行代码都会变成强有力的势能,加速行业发展进程。该团队还称,这个领域没有象牙塔,只有纯粹的车库创业精神与社区共筑的创新力量。