虽然成功还有距离,但庆幸自己在做一件难而正确的事情。
编者按:本文来自微信公众号 爱倒腾的程序员(ID:taosdata),创业邦经授权转载
2017年6月6日,涛思数据正式成立,一晃六年就过去了。一般创业公司很难熬过三年,但涛思数据居然熬过了六年。《编程之美》《构建之法—现代软件工程》作者,CSDN副总裁邹欣对我六年创业提了六个问题,借此机会,我把数据库赛道的创业机会、挑战等方面的观察和思考清晰的表达出来,现转载与大家分享、共勉。
TDengine数据库创始人陶建辉在朋友圈分享六周年庆祝视频时说道:“一般创业公司很难熬过三年,我们居然第六年了,值得庆祝一下。”
6年前的今天,涛思数据正式成立,团队也从起初的5个人发展到近百人,TDengine在全球的安装实例已超26万,并每天按500以上的速度增长。陶建辉坦言:虽然成功还有距离,但庆幸自己在做一件难而正确的事情。
涛思数据核心成员
邹欣第一问:现在和6年前,你对数据库赛道的看法有变化吗?
陶建辉:大的来讲,我对这个这个赛道的看法没有任何改变。做数据库创业,无论是过去,还是现在,都是极其之困难,只有能坚持、追求长期价值、乐意做难而正确的事情的人才适合这个赛道。爱跟热点创业的人完全不合适的。
数据库的类型已经百花齐放,除传统的关系型数据库之外,现在有NoSQL数据库, 时序数据库(Time Series Database)、图数据库、向量数据库等等。对于关系型数据库而言,还是如同我6年前的判断,这是一个已经形成垄断的市场,机会几乎不存在。虽然在中国,有国产化替代的需求,但市场空间并不大,对Oracle这类公司在全球市场无法构成任何威胁。
到时序数据库赛道而言,我认为现在的竞争已经接近尾声。因为InfluxDB已经在市场做了10年,即使它产品一般,但市场占有率已经很高。我们TDengine已经6年,全球安装量已经超过27万套,而且每天新增至少500套以上,其他时序数据库产品要赶上InfluxDB或TDengine,已经相当困难。TDengine在全球市场赶上InfluxDB, 也还需要我使出全身的力气,增长速度至少还要翻倍才有可能。6年前我做时序数据库,有那么一点点机会,那么现在做,这个机会是几乎没有了。
随着新的应用的出现,一定需要新的数据处理工具。最近特火的向量数据库,核心原因是AI的火爆。如果你3年前甚至更早就在耕耘向量数据库,那么你今年至少会得到资本市场的热捧,而且这个赛道一定会出来至少一家100亿美元的公司。
因此做数据库创业,机会永远存在,就看你是否有前瞻性,对未来的判断,是否敢赌。但做已经被垄断的市场,如果你的产品无论是性能、功能还是稳定性不比现有的好5倍以上,而且有足够的市场推广能力,我建议千万不要头脑发热。
邹欣第二问:当初的团队,6年后还有多少仍然在奋斗?他们为何离开?
陶建辉:我们创业团队,除三个月内主动或被动离开的之外,至少前10号员工全部还在团队继续战斗,这是我十分欣慰的事情。他们之所以没有离开,核心原因是看到了公司的增长,个人价值的提升。如果今后离开了,那一定是他们觉得个人价值不能得到更多的提升。
TDengine成立后的前2年,包括我自己,就五个人,到第三年,增加了一位。团队真正扩张,是在2020年疫情爆发以后。我对初期的员工,精挑细选,而且要求很高,3个月内,不符合我要求的,我一定会请走,前30位入职的,至少有一半都走了。比如销售,我请的前4位销售,经历背景都很光鲜,但都是不到2个月,都走了。
邹欣第三问:6年来世界也有很大变化,我们经历了3年一起,大部分创业特团队都活不过三年,你们6年发展壮大,和其他创业团队最大的区别是?
陶建辉:如果只能说一个区别的话,那就是选对了赛道。6年前,我在给人聊时序数据库,几乎没人知道,也没有人乐意听。但我们赶上了物联网、工业互联网的爆发,赶上了大家对国产基础软件的狂热支持和期盼,而且选择了正确的推广方式,开源。
再说一个区别的话,那就是由于我是创业老兵。这是我第三次创业,以前吃过很多苦头,踩过无数的坑,因此懂怎么建立精小的团队,怎么做减法,而不是加法,知道钱应该花在哪里,知道怎么给产品精准定位。
邹欣第四问:如果穿回6年前,有什么事情是你最想改变的?
陶建辉:如果回到6年前,我初创团队里一定要引入一位在海外能做研发、又有一定市场运营经验的人。在全球市场,我们现在声量还不大,因为我直到2022年8月才开始真正有动作。最好的市场推广窗口已经错过,让我们赶上并超越InfluxDB的难度大了很多很多。如果2017年我们就在海外的技术社区、媒体、活动开始发声、露面,那现在就容易多了。
邹欣第五问:数据库这门技术,在大学也讲了很多年了,也出现了大数据等专业,你认为学校数据库的学生,除了传统的“增删改查“,还应该学什么技能
陶建辉:应该学习数据库怎么选型。因为现在的数据库种类越来越多,世界上没有十全十美的数据库,都是针对场景设计的。因此学生需要学习什么场景下,应该选关系型数据,是OLTP还是OLAP型,什么场景下,应该选时序数据库,什么场景下,应该选NoSQL等等。
而且除数据库之外,应该学习更多的data engineering需要的比如消息队列、流式计算的原理以及流行的工具。
邹欣第六问:展望下一个6年,你认为数据库/大数据应用会有什么改变?目前火热的AIGC/LLM技术也会颠覆数据库应用么?
陶建辉:数据库是基础设施,是任何软件的基座,不会由于AI的出现,关系型数据库就不要了,时序数据库就不要了,他们依然还会存在,而且依然增长。就好比电力,并没有由于互联网的出现,电力就不需要了。
AIGC/LLM的火热,能让新型的向量数据库更加成熟、在AI应用里扮演重要的角色,催生出一到三家成功的以向量数据库为核心业务的公司。
对于现有关系型、时序型、NoSQL或其他数据库而言,需要做的就是积极拥抱AI,能让自己与各种AI工具无缝集成。