PHP企业研发-核心基本模块设计-化学方程式两端的企业级数据

wloe2gf · 发表于 2024-11-3 14:32:22

6.2 化学方程式两端的企业级数据

先来讲一下企业级网站数据的多级缓存。

缓存的运用，针对有项目研发经验的技术人员来讲，都不陌生。在PHP研发中，能够运用的缓存有非常多，譬如文件缓存、APCU缓存、数据库缓存、SESSION缓存、COOKIE缓存、Redis和Memcache缓存等。但这些都只是存储的方式区别，已然表现在功效上。而在这往前一点，则是咱们针对数据的理解。理处理定运用。形成系统有两大核心要素：数据与程序。其中针对流通在二进制中世界中的数据，它的品质和价值，不取决于咱们缓存的方式有多好，而在于咱们对它的理解有多深。

这儿供给了一种数据可视化管理的新视角，基于这个新视角，从而讨论组织数据的方式，最后落地到多层缓存架构的设计与实现。

6.2.1 数据划分的新视角

在用户打开浏览器，拜访网站的页面后，会看到非常多形式多样的内容、信息和照片、视频等。这些都源自于后端代码处理、加工和整合的数据。当网站系统成长到必定规模的时候，这些数据会来自四面八方，有从数据库提取的，有从接口请求的，有读缓存的，亦有根据公式、规则实时计算的，不一而足。更让人无可奈何的是，在过往项目迭代中，都缺少对这些数据的统一管理、规划和守护，导致于来一个新数据，就不加思虑“茫然”堆彻。最后造就了混沌、乏力的数据体系。

图6-1 传统网站数据的划分，混沌而乏力

那应该怎么组织企业级网站数据，才是行之有效的呢？

软件研发这一行业，有不少灵感是从其他行业、自然界启发而来的。咱们不妨先来回想一下高中时代学习的化学方程式。能够说，有时化学方程式繁杂到我怎么背都背不下来，但我晓得在化学方程式的左边是反应物，右边是生成物，而中间是反应要求。实质上，化学方程式是很容易理解的，并且它能够清晰、准确、恰当地暗示繁杂化学反应的本质。

此刻，做为软件开发工程师的咱们，有无发掘错误繁杂的网站数据与化学之间的微妙关系？

一方面，由分子构成的化学物质，有活泼、稳定之分。越活泼的物质变化越快，反之，越稳定的物质变化缓慢，能够安置很长一段时间。而针对网站数据，有的需要频繁更新乃至实时更新，如商品库存；有的则相对稳定，不需要频繁更新并在业务上能够接受一按时间的延时，如商品的信息；有的乃至非常稳定，一般很长的时间内都不会出现变化，如全站的通用开关配置。

另一方面，化学反应前的分子，会在特定的要求下，产生化学反应，从而生成最后新的分子和产物。针对网站数据，道理是类似的。所获取到的原始数据，一般都不会直接输出到页面，而是会经过一系列的操作，加工处理，包含数据在业务层面的二次转换、包装、排序，亦包含了技术层面的缓存、队列、多线程等。经过各函数、类、接口、模块处理后，才会形成咱们最后呈现给终端用户的信息。

这般，联想到原子的轨道图，按照网站数据自己的稳定程度，咱们能够得到一种新的企业级网站数据新视角。

图6-2 数据的稳定程序指的是数据变化的频率，频率越高越活泼，反之越稳定

当一个网站是企业级网站时，就整体页面而言，它需要很高的响应速度。细分下来，页面各数据需要具备合适的缓存策略，并能以一种简单明了的方式来进行管理。这些数据，肯定不是杂乱无章地存在系统之中，而是以某一种特定的方式，遵循某种规律，有序地分布在系统中。咱们没找到，并不暗示这种规律不存在。若按这儿所说的新视角，能够显著发掘，针对以往混沌的数据，此刻有了全新井然有序的划分规律。

图6-3 传统数据分布与新视角的划分对比

在这基本再进一步，咱们能够推演出正确运用企业数据的方式，通俗来讲便是“打开企业级网站数据的正确姿势”。为了在有效缓存和实时性之间取得更好的平衡，需要为区别的业务数据，按照各自的稳定程度，为其选取区别的缓存策略。例如针对列表页的档期信息，因为拜访频繁，不可每次都直接从数据库中读取，而是应该进行缓存之。又如针对成千上万个细粒度的商品信息，倘若运用的是本地缓存，亦是不恰当的，由于本地缓存空间有限，基本容纳不了那样多组合状况的海量商品列表，最后会引起本地缓存频繁淘汰，反而适得其反。

结合数据的稳定程度，和数据拜访的状况，能够引出数据稳定-拜访象限分布图。

图6-4 数据稳定-拜访象限分布

这个数据稳定-拜访象限分布图特别有意思，值得花点时间来科研和学习。一旦把握其中的要点，针对后面设计和规划企业级网站数据将会大有裨益。能够看到，前面是按数据自己稳定程度单一维度进行划分，此刻是结合数据的使用场景，即增多了数据拜访的频率这个新维度，从而构成为了此象限图。那样这象限图又能够给到咱们什么启发呢？

就这儿的图而言，左上角的实心大圆圈暗示最稳定的数据但又是拜访得最多的数据，例如全局配置数据，几乎每一个页面都会用到，最平常的莫过于网站的标题、Logo照片链接这些基本公共信息。在这个区域要重视的一点是，缓存时要避免Hot Key问题。右上角暗示极不稳定的数据，一样需要高频拜访，例如商品的库存。尤其在秒杀活动的时候，针对库存的数量需求就更严格了，一个亦不可少，一个亦不可多，否则就会显现超卖的现象。此时，需求的数据都是具备实时性的，不可缓存，或即便缓存亦要快速同步，由于有时效性需求。

再来看下半部分，左下方区域暗示既稳定、拜访次数又少的数据，因此呢咱们不消那样担心，能够缓存很长一段时间，亦能够运用有些低速的缓存方法。例如资讯文案一经审核发布后，基本不会再作修改，但并不是每篇文案都会高频拜访。最后针对右下方象限，则又是另一个需要尤其关注的地区。在这个区域，数据是不稳定的，容易出现变化，但拜访量时高时低，流量不确定。一般咱们的核心业务数据就落在这个区域内，占据了大部分网站数据。这些数据可能是用户生成的，或是经过管理后台发布编辑而来。例如用户发布的博客，在供应商管理系统录入的商品信息等。

针对网站数据本身的特质，咱们能够按照数据的稳定程度来对数据进行归类划分。而后，结合数据的运用场景，思虑其拜访量的状况，得出数据稳定-拜访象限分布图。这是一个新的数据管理视角。下面咱们再来看下，在这新视角的基本上，能够得出怎么样的架构设计，从而实现多级缓存和可视化管理。

6.2.2 运用缓存的平常例子与坏处端

如前面所说，在PHP中能运用的缓存方式有非常多，例如文件缓存、Redis缓存、APCU缓存等。但此刻咱们缺的不是缓存的技术，而是缺乏正确运用缓存的方式，以及恰当组合运用多级缴存的策略。先来看一个普通运用缓存的简单例子。

一个平常的场景是获取用户的个人信息，按照用户的ID查找数据库中的用户表，而后返回相应的用户信息。这儿暂时不关注底层实现，以下是调用的代码示例。

<?php // 用户ID $userId = 1; // 从数据库获取用户信息 $model = new User(); $userInfo = $model->getUserInfo($userId); // 输出用户信息 var_dump($userInfo);

当需要运用缓存时，下面的代码写法亦是很平常的，亦很容易理解。

<?php // 用户ID $userId = 1; // 从缓存中获取 $cache = new Cache(); $key = userinfo_ . $userId; $userInfo = $cache->get($key); // 缓存无 if (empty($userInfo)) { // 从数据库获取用户信息 $model = new User(); $userInfo = $model->getUserInfo($userId); // 同步写入缓存，缓存10分钟 $cache->set($key, $userInfo, 600); } // 输出用户信息var_dump($userInfo);

虽然这是公众运用缓存的方式，初步看起来亦无什么问题，但试想一下，打开一个企业级网站页面时，需要的数据数量从几份到十几份不等，而一个企业级系统中的数据规模更加是能够达到成千上百个。再深入思考一下，倘若都是根据这种初级的缓存运用方式，将会催生多少重复性的代码？除了混乱外，还增多了守护的成本。关于重复性的代码，又分为两类，一类是显而易见的重复代码，基本都是“拷贝-粘贴”式的代码；另一类是隐式的重复，很难察觉，表面上看起来有点类似，但无显著的重复。而这儿运用缓存的初级方式就属于后者。这亦是非常多编程研发人员无发掘，或无留意发掘的原由。

至于为何，后面加入的新团队成员，即便她们有这种洞察的能力，亦没能去做出好的改变呢？我想这是社会认同感的作崇。当一个新成员加入到团队后，他在写新代码前都有认识或无认识参考之前代码的写法，而后模仿之。这是有原由的，咱们非常多团队都会约定自己的编程风格和规范，即需求新人不可标新立异。另一方面，新人模仿前人写的代码，亦能很大程度上避免过往遇到过的缺陷。然则规则是需要树立的，但亦需要打破的。遵循规则，能够保持顺畅；而打破规则，则能够实现创新，得到突破。

再回过头来看这儿的例子，相信读者在日前工作的项目中亦不乏发掘这类状况。那它的问题是什么呢？咱们又该怎样改进或应对呢？

倘若咱们把上面运用缓存的例子，加以分析，就能发掘在短短的十来行代码里，其实它做了非常多事情。

第1步，构建查找参数。这儿参数仅有一个，即用户ID，但亦有可能需要多个参数。第二步，获取缓存数据。详细的缓存方式这儿无指定，能够是文件缓存、Redis缓存或APCU缓存。第三步，当缓存无数据时，进入第四步；否则进入第六步。重视缓存的key要与参数相对应。第四步，从数据源获取原始数据。这儿的原始数据存放在数据库中，但亦有可能需要从远程接口获取，或其他存储媒介。第五步，将原始数据同步写入缓存，并设置缓存时间。第六步，返回或输出数据结果。

从上面六个过程中，咱们不禁发问：数据应该采用何种缓存方式，应该设置缓存超时时间为多久？而这又是出于何种思虑或依据？这儿混合了两个层级，一个是高层的概念层，一个是底层的实现层。做为客户端研发人员，他所关心的是获取到用户的信息，而不关注详细怎样获取。那有什么办法能够把缓存机制运用的这套模板抽取出来，既能分离关注点，又能达到代码重用的效果呢？最后一个问题，假设咱们期盼在获取到数据后还想进行有些实时计算的操作，又该怎样设计、研发和扩展？

这些问题，归根到底，都是技术与业务关注点混杂的后果。从业务方向上看，咱们期盼按照用户ID就能提取用户的信息；但落实到技术代码编程实现时，技术人员就无认识地思虑到技术实现的细节。我该怎么存数据，我又该怎么缓存数据呢？这儿顺便延伸说一下，咱们软件研发工程师所任职的大部分机构都能够分为三类：纯技术驱动型的且以线上虚拟世界为主的信息机构、业务驱动型的互联网机构、和需要增设技术分部却不倚重技术的传统企业。除了第1类机构外，大部分业务驱动型机构的核心竞争力都表现在制品业务上，而做为在这类机构内任职的研发人员，亦便是咱们，更加多应该思虑的是怎样经过技术快速支撑业务的发展。

顺着这个思维再稍微想多一步，咱们就不难发掘，回归到例子中用户信息的获取，这便是业务的需要。而为了更快地获取用户信息而运用缓存，则是咱们技术本身的需求罢了。倘若不加思虑，茫然顺从的运用初级的方式，持续编写重复性代码运用缓存，不仅增多了偶然的繁杂性，还拖慢了快速交付有价值业务的进度。并且，倘若咱们需要从宏观上对某一大类的数据进行调控时，例如在拜访量低时，我们容许能够直接查找数据库以得到数据的实时性，当拜访量增多时，咱们则要运用缓存，以损失短暂数据有效性为代价换取高可用的服务质量。倘若原来的代码像七龙珠那样，分散在世界各地，等咱们历经千辛万苦齐集时，世界早已出现巨大的变化。

咱们应当始终关注业务的需要，而后把技术的关注点从中剥离出来，实现技术与业务的关注点分离。所提取出来的抽象、通用的技术处理方法，要么是一个微架构，要么便是一个行业通用的行业标准。有了这般的认识后，再来看下怎样进行核心的设计，以满足技术上非功能性的各样需求。

6.2.3 数据供给器

为了实现技术与业务的关注点分离，接下来将探寻可行的处理方法。

近期，在咱们团队研发的项目中，我发掘了运用匿名函数来封装原始数据获取的方式。大致的实现方式，应用到咱们的例子的示例代码如下：

<?php // 用户ID $userId = 1; $key = userinfo_ . $userId; // 经过匿名函数封装原始数据的获取$userInfo = smart_cache_retrieve($key,600, function () use ($userId){ // 从数据库获取用户信息 $model = new User(); $userInfo = $model->getUserInfo($userId); });

这种方式，确实抽取了缓存运用的模板，在某个程度上达到了重用的效果。但我觉得不足优雅，亦不足正统。

首要，它运用了面向过程编程的匿名函数，并不是说面向过程编程的写法就欠好，而是在于PHP本身是一门脚本解释性编程语言，其语法是很通俗易懂的。另外，匿名函数不是PHP的一等百姓，PHP的上下文与闭包函数并不是很完美，亦不是它的侧重点。针对闭包函数支持较好的语言，我认为是Javascript。或许，咱们能找到一种更符合PHP本质、更易被接受的架构设计。好的架构设计不会让人觉得有意而为，或刻意要去学习和被迫接受，而是能让人顺其自然，根据约定成俗的方式去理解和运用。另一个不足友好的地区是，关于缓存的三要素：缓存的key，缓存的超时时间，缓存的数据。其中在这儿缓存的key和缓存的超时时间是暴露给客户端的，难以统一掌控。另外，倘若客户端研发人员A与研发人员B，刚好起的缓存key名字冲突了怎么办？谁来发掘，由谁来处理？这不是杞人忧天，而是为作理性的技术人员，咱们要尽可能做到严谨，思虑周全。

数据供给器的核心设计

在前面做了那样多铺垫，亦对比了一个不怎么优雅的处理方法后，咱们最后引出在面向对象的世界里，举荐的处理方法——三套数据模板的核心架构设计。这儿不会作仔细的详细实现，但会着重分享这个核心架构设计的高层建设与实现要点。

按照“针对接口编程，而不是针对实现编程”这一思想，咱们需要在概念视角，站在业务的方向，构建设计咱们的高层接口。咱们把这类业务数据的获取封装到数据供给器DataProvider这一接口中。其肩负的责任，从以下的接口代码中能够一眼看出。运用抽象类的原由，是由于部分内部操作和钩子函数不需要对外暴露，要运用protected守护级别，而接口的操作所有在PHP中必须是public公开级别。另一个原由是有有些通用的模板实现和默认的钩子实现，需要在抽象基类中实现，减少详细实现子类的重复编程工作。下面是DataProvider抽象类的关键代码。

<?php require_once dirname(__FILE__) . /DataQuery.php; /** * 数据供给器接口 * * - 接口抽离，便于在高层统一接口 * - 经过多级缓存来优化性能 * - 支持全世界跟踪器链路收集 * *@author dogstar 2018-06-17 */ abstract class DataProvider { /** * 获取业务数据 * * @param DataQuery $query 获取业务数据的查找对象 * @paramstring &$trace 全世界跟踪收集器 *@return mixed/NULL 业务数据，NULL暗示获取失败 */ public function getData(DataQuery $query, &$trace = ) { $cache = $this->getCacheInstance(); $key =$this->getCacheKey($query); // 从缓存中获取 $data = $cache->get($key); if ($data === NULL) { // 从数据源获取 $data = $this->doGetData($query, $trace); // 写入到缓存 $cache->set($key, $data, $this->getCacheExpireTime($query)); } // 钩子函数回调 $this->afterGetData($query, $data); return$data; } }

稍微解释一下，DataProvider::getData(DataQuery $query, &$trace = )操作是供给给客户端研发人员运用的接口，经过这个接口，能够快速方便地获取业务数据。在这个接口内，会封装一系列的操作，包含对缓存的读取与写入，对原始业务数据的获取，以及获取到原始业务数据后的加工处理等。它的第1个参数是查找对象，为避免过长的参数列表，亦为了统一接口签名，咱们引入了DataQuery查找对象类，它相当于一个结构体，能够不需要getter/setter，并且运用了魔法办法丰富它的行径。第二个参数是全世界跟踪收集器，简单来讲，业务数据走过的路，经历过的节点，都能够记录在这上面，便于可视化管理和历史回放。关于全世界跟踪器，下一小节会重点讲解。

内部辅助操作

核心的代码实现，以及关键的操作，已然在DataProvider::getData(DataQuery $query, &$trace = )中完成。它做为对外的总入口，供给了清晰明了的运用方式。但客户端的运用越简单，内部的实现就会越繁杂。因此咱们需要保持有些耐心继续往下看DataProvider抽象类的两大内部辅助操作。

第1类内部辅助操作，是针对业务数据的处理，包含对原始业务数据的获取，以及在获取业务数据后的加工处理钩子函数。如下所示：

abstract class DataProvider { …… /** * 返回需要缓存的原始数据 * *@param DataQuery $query 获取业务数据的查找对象 * @param string &$trace 全世界跟踪收集器 * @returnmixed 重视：无数据时请返回空数组array()，或，切勿返回NULL/FALSE */ abstract protected function doGetData(DataQuery $query, &$trace = ); /** * 钩子函数：数据的实时处理操作，将会在业务数据成功获取后进行回调 *@param mixed &$data 业务数据 * @return mixed 加工处理后的业务数据 */ protected function afterGetData(DataQuery $query, &$data) { // 可选实现：加工处理 } }

第二类内部辅助操作，则是针对技术层面的缓存操作，包含获取缓存实例，方便内部供给缝纫点，从而切换区别的缓存策略，和获取缓存的Key、返回缓存有效时间这两个操作。如下所示：

abstract class DataProvider { …… /** * 获取缓存实例 * @returnCache 缓存实例 */ abstract protected function getCacheInstance(); /** * 获取缓存的Key，返回独一缓存key，这儿将$query传入，以便同类数据按照区别的值生成区别的key * * @param DataQuery $query 获取业务数据的查找对象 * @return string 缓存key */ abstract protected function getCacheKey(DataQuery $query); /** * 返回缓存有效时间，单位为：秒 * *@param DataQuery $query 获取业务数据的查找对象 * @return int 缓存有效时间 */ abstract protected function getCacheExpireTime(DataQuery $query); }

而针对getCacheKey()操作，无供给默认实现的原由是由于查找参数里面的参数有可能是除了字符串类型外，还可能有数组、布尔值或其他类型。倘若统一处理，有可能导致数据丢失，或由于特殊的符号影响缓存key的构成，显现违法缓存key的状况。况且，有时并不是所有的参数都需要做为缓存key的构成部分。

参数查找对象

完成对数据供给器DataProvider的塑造后，再来看下它的周边配套设备。其中最为关键的是参数查找对象类DataQuery。它的实现代码很简单，其中运用了两个魔法函数：__set()和__get()。

<?php class DataQuery { public function __set($name, $value) { $this->$name = $value; } public function __get($name) { return isset($this->$name) ? $this->$name : NULL; } }

这是一个松散的结构体，业务在实现时，能够丰富其子类，清晰定义查找对象的详细参数名叫作，亦能够运用此默认的实现类，而后填充必要的参数。但意见运用前者。

最后稍微弥补一下，此时亦会运用到缓存，但鉴于缓存本身的实现已然是广为人知的技术，这儿就再也不尤其说明。

6.2.4 3+1套数据模板

至此，咱们有了基本的核心元素：数据供给器和参数查找对象，以及缓存机制。还记得前面介绍过的数据稳定-拜访象限分布吗？数据按照其稳定程度和拜访频率能够分为四类：

稳定但高频拜访的数据稳定且低频拜访的数据不稳定且高频拜访的数据不稳定但低频拜访的数据

下面将探讨怎样运用基本的核心元素，为这四类数据供给合适的数据模板，逐步丰富咱们的数据体系。

3+1套数据模板，其中的3套数据模板是分别针对稳定且低频拜访、稳定但高频拜访、不稳定但低频拜访这三类数据的模板，它们依次是：轻量级数据模板、重量级数据模板，和介于这两者之间的多级缓存数据模板。剩下的1套数据模板则是针对不稳定且高频拜访的数据，亦便是不适宜运用任何缓存的实时数据，对应的是实时数据模板。

前面3套数据模板的差异点重点是在于缓存机制和缓存策略的区别，着重满足业务数据本身的非功能性需要。这儿以其中一个模板为例，讲解怎样实现。其他模板实现思路类似，则再也不赘述。

以轻量级数据模板为例，它的抽象类代码如下：

<?php require_once dirname(__FILE__) . /DataProvider.php; // 轻量级数据模板 abstract class LightWeightDataProvider extends DataProvider { protected function getCacheInstance() { return newLightWeightCache(); }protected function getCacheExpireTime(DataQuery $query) { return 600; } }

它做了两件事情，分别指的是定了运用LightWeightCache轻量级缓存机制，以及统一指定了缓存的有效时间为600秒，即10分钟。LightWeightCache的详细实现，能够是运用集群缓存，如Redis、Memcache或其他NoSQL服务。

继续回到前面的用户信息的获取示例，在改用此轻量级数据模板后，它需要首要实现详细的数据模板子类，以及供给相应的查找对象子类。关联代码如下：

<?php require_oncedirname(__FILE__) . /LightWeightDataProvider.php; // 实现详细的业务数据获取，如：获取用户信息 class UserData extends LightWeightDataProvider { protected function doGetData(DataQuery $query, &$trace = ) { $model = new User(); return $model->getUserInfo($query->userId); } protected function getCacheKey(DataQuery $query) { return userinfo_ . $query->userId; } } // 用户信息查找对象 class UserInfoDataQuery extends DataQuery { public $userId; }

在完成前面的准备工作后，最后再来看下客户端调用的新代码。

// 实例化 $user = new UserData(); $query = new UserInfoDataQuery(); // 经过轻量级数据模板获取用户信息 $query->userId = 1; $userInfo = $user->getData($query); // 输出结果var_dump($userInfo);

在完成这般的设计，以及编程工作后，倘若需要切换区别的缓存策略，能够在不改动客户端调用代码的状况下，只需要切换UserData子类继承区别的数据模板基类就可。

倘若要追求极致的代码，还能够对上面的客户端调用代码进行封装，而后经过简化版的调用向客户端供给获取用户信息的快速通道。由于在上面的代码片段中，独一变化的是用户ID这一参数，故而能够提取到一个类静态函数的内部。如下：

class UserInfoHelper { public static function get($userId) { // 实例化 $user = new UserData(); $query = newUserInfoDataQuery();// 经过轻量级数据模板获取用户信息 $query->userId = $userId; $userInfo = $user->getData($query); return $userInfo; } } // 输出结果var_dump(UserInfoHelper::get(1));

以上，是轻量级数据模板实现的基本思路，剩下的重量级数据模板和多缓存缓存数据模板实现的思路与之类似，区别的是运用的缓存策略不同样，默认指定的缓存失效时间亦区别。但实时数据模板比较有意思，它是一个特例，咱们一块来看下。

首要，亦是数据供给器的抽象子类，在这儿它供给了一个空对象缓存实例，由于不需要缓存，因此缴存的key和缓存时间默认能够为空。

<?php require_once dirname(__FILE__) . /DataProvider.php; // 实时数据模板 abstract class RealTimeDataProvider extends DataProvider {protected function getCacheInstance() { return new NoneCache(); } protected function getCacheKey(DataQuery $query) { return ; } protected function getCacheExpireTime(DataQuery $query) { return 0; } }

倘若哪天在获取用户信息时，再也不需要任何缓存时，只需要将UserData类的基类改为RealTimeDataProvider就可，如下所示：

<?php // 更换为实时数据模板 // class UserData extends LightWeightDataProvider { class UserData extends RealTimeDataProvider { protected function doGetData(DataQuery $query, &$trace = ) { $model =new User(); return $model->getUserInfo($query->userId); } }

其他的实现代码和客户端调用能够保持不变。由此可推，逆向亦是成立的。即一起始无运用缓存，倘若需要运用缓存，亦可经过改变基类来切换。

这便是咱们所说的3+1套数据模板。最后做为小结部分，咱们画一个整体的静态类结构UML图，来加深对此核心架构设计的理解。看下它是怎样分离技术与业务关注点，又是怎样把概念视角、规约视角、实现视角这三层进行划分的。

图6-5 数据供给器的核心设计

这个架构设计，把咱们前面讲到的关键要素、3+1套数据模板、以及详细实现的业务类都有机地串联了起来。根据三层视角，从上往下依次是概念层、规约层、实现层。概念层与规约层的划分，有效地分离了技术与业务的关注点，在业务上，我只需要关注业务的数据的获取就可，而不消关心它是怎么来的。规约层与实现层的划分，则将架构的基本组件设计与详细实现的业务代码进行了分离，类的职责更为知道，架构师与研发工程师之间的合作亦就更为明朗。实现层是需要研发工程来按照业务详细实现的，而规约层则能够由架构师来统一安排、搭建和设计。

在大学时代，咱们就学到了，程序由算法和数据构成。数据中包含了非常多有价值的信息，因此呢很值得咱们花一点时间来深入讨论这一起。关于企业级网站数据，暂时分享到这儿。这肯定不是放之四海而皆准的方法，不必定能适用于任何项目研发中，但它确实是行之有效的一种处理方法，并且值得咱们去思考、去探索、去演进。

6.2.5 全世界跟踪器

接下来的主题是怎样进行企业级网站数据的可视化管理。

前面提及到的全世界跟踪器，这一节重点来仔细说明。为了方便查看数据的源自和穿透状况，咱们引入了对数据源自的跟踪，并且各业务数据能够按照需要进行记录累加。

在前面设计数据供给器时，为避免混淆关注点，已然为全世界跟踪器预留了占位符，这儿继续完成全世界跟踪器的实现代码。以轻量级数据模板为例，追加全世界跟踪器，只需要修改三处地区。

首要，在客户端调用入口处，亦便是跟踪器的起点，添加业务数据的名叫作，并把此跟踪链路字符串传递下去。

$query->userId = 1; $trace = |UserData-; // 全世界跟踪器：用户信息（起点） $userInfo = $user->getData($query, $trace);

这儿以竖线为多个数据的分割符，并且以UserData做为用户数据的名叫作。为了减少最后输出的流量，以及避免外界晓得内部的数据状况，亦能够采用缩写的形式，例如运用：UD。

其次，修改轻量级数据模板，统一加上跟踪标识。此时需要重载基类的getData()办法，在追加完标识后，继续调用父类的getData()办法。

abstract class LightWeightDataProvider extends DataProvider { public function getData(DataQuery $query, &$trace = ) { // 全世界跟踪器：轻量级数据模板，追加L标识 $trace .= L; return parent::getData($query, $trace); } }

L在这儿暗示数据经过了轻量级数据模板，依此类推，重量级数据模板能够用H暗示，而多级缓存数据模板能够用M暗示，最后实时数据模板能够用R来暗示，都是取自类名叫作的首字母。

最后，在详细实现的业务数据子类中，追加最后数据源的源自标识。一样运用开头首字母来暗示，例如D暗示源自数据库，A暗示源自于APCU缓存，针对Redis和Memcache，思虑到前面已被数据模板占用，能够起用新的名叫作，如取最后一个字母，S暗示Redis，而E暗示Memcache。这些都是能够内部约定的。在用户数据实现的子类中，因为是从数据库获取用户信息，故运用D来标识。

class UserData extends LightWeightDataProvider { protected function doGetData(DataQuery $query, &$trace = ) { // 全世界跟踪器：数据库 $trace .= D; $model = new User(); return$model->getUserInfo($query->userId); } }

完成这些跟踪器的填充后，最后能够把跟踪的结果输出来。例如这儿，最后会输出“|UserData-LD”。倘若把全部网站页面用到的数据都这般加上跟踪器，咱们最后就能够得到数据可视化管理的全局状况。在页面渲染时，能够经过头部信息把跟踪的结果返回给浏览器，便于咱们监控、调试和排查。按照此业务数据链路跟踪的状况，咱们能更易察觉现有系统中存在的问题。例如该用缓存的数据是不是运用了合适的缓存；针对容易因穿透而导致雪崩的数据咱们有无提前经过计划任务来生成并预热；倘若数据未能即时更新，是由于缓存还没刷新还是由于确实数据本身未被修正；诸如此类。能够说全世界跟踪器，怎样应用恰当，会是咱们项目研发中的一大利器。

思虑到非常多时候，网站都要供给预览的功能，倘若想追求更极致的数据供给器，咱们能够在对象查找对象添加读缓存开关、写缓存开关，以便能够随时切换是不是运用缓存。当缓存读开关的状态为开启时才读取缓存，一样当写缓存开关状态为开启时才写入到缓存。这儿的实现很简单，留给读者做为课后作业，有兴趣的朋友能够尝试一下。

做为本节小结，咱们经过一个表格来汇总此次新的数据管理方式，与传统做法的差异有那些。

表6-1 传统数据管理与新数据管理方式的对比

归类与要点

传统数据管理

新的数据管理方式

面向运营的预览

手动支持，需要手动切换是不是运用缓存

统一自动支持切换

面向运营的强制刷新

一般不支持或手动支持

支持，页面拜访时可运用强刷模式

业务路径触达

只能靠人工经验判断业务路径

可视化，经过专业术语标识能精确描述业务场景

数据规划中的缓存策略

不知道、不清晰

有序，按稳定-拜访象限清晰，并且可视化

数据规划中的缓存时间

各自指定，较为凌乱

统一规划，支持自定义

用于故障排查的页面跟踪

不支持

支持，更可视化

用于故障排查的穿透查看

不支持

支持，能够清楚晓得数据从哪里来

在线调试

不支持

支持

用于后台作业的计划任务生成

难以支持

支持，可快速模拟数据获取，以触发有效缓存填充

快速研发与效率的提高

拷贝-粘贴式重复研发，容易出错

模板支持，便于快速研发

研发规范与标准化

缺乏标准

有利于形成企业级架构设计，由于形成为了统一的接口规约

这套数据管理的架构，能显著加强代码研发的效率，由于研发人员不消再需要关注并且重复编码实现详细重复实现的缓存策略，取而代之是选取合适的数据模板就可，相当于让程序员做选取题而不是简答题，乃至能够容易切换区别的缓存策略。另一一个方向，咱们对各样稳定数据、活跃数据、实时数据都有了更为清晰的划分，因此呢亦就大大降低了对业务数据守护的成本，并且使得原来混乱的业务数据变得更有序可循。另外，全世界跟踪器为测试、研发人员供给了重要的上下文场景信息。

能够说，某种程度上，这是一种企业级的架构设计。

j8typz · 发表于 2024-11-8 15:57:41

顶楼主，说得太好了！

		自动登录	找回密码
密码			立即注册