推荐:《PHP视频教程》

phpjieba_ffi

使用PHP 7.4的 FFI 测试直接调用cjieba分词的动态库

选用CJieba的原因是FFI使用的是C的调用约定,如果用Cpp,还得自己包装一下,然后extern C,让编译器生成标准C的动态库。

碰到的问题

段错误

C变量没有初始化

直接调用了C的函数,没有通过FFI 初始化后的的C对象调用

非空判断 需要使用 FFI::isNull($x)

指针形式的数组 不能用foreach

指针形式数组的循环

查看C代码发现Cut部分如下:

CJiebaWord* Cut(Jieba handle, const char* sentence, size_t len) {  cppjieba::Jieba* x = (cppjieba::Jieba*)handle;  vector<string> words;  string s(sentence, len);  x->Cut(s, words);    CJiebaWord* res = (CJiebaWord*)malloc(sizeof(CJiebaWord) * (words.size() + 1));  size_t offset = 0;  for (size_t i = 0; i < words.size(); i++) {    res[i].word = sentence + offset;    res[i].len = words[i].size();    offset += res[i].len;  }  if (offset != len) {    free(res);    return NULL;  }  res[words.size()].word = NULL;  res[words.size()].len = 0;  return res;}

返回的是一个结构体指针,在C语言里,数组名实际是数组第一个变量的指针地址,所以可以通过指针地址++的操作来遍历,在FFI里面呢?

对于这个数组,我一开始用foreach 循环,直接报段错误了,后来和C一样,直接用指针++,发现是可行的,这里给FFI点赞,居然也可以直接操作C指针。

分词结果获取

如上面的代码,对于单个分词CJiebaWord,也不是保存的分词,而是sentence + offset,就是说第一个分词结果肯定是原始字符串。

在C的demo里是printf格式化(. 表示字段宽度和对齐),但是PHP里没有类似的方法,需要截取字符串substr($x->word, 0, $x->len)

  for (x = words; x->word; x++) {    printf("%*.*s\n", x->len, x->len, x->word);  }

用法示例

编译动态库

make libjieba.so

运行

time php demo.php

运行c demo

make demotime ./demo

结果

PHPload: 0.00025701522827148real    1m59.619suser    1m56.093ssys     0m3.517sCreal    1m54.738suser    1m50.382ssys     0m4.323sCPU 占用 基本都是 12%

可以发现使用FFI,PHP的速度基本和C差不多,如有CPU占用大的业务,可以尝试使用其它语言(C/C++,golang,Rust等)编写然后导出标准C的动态库。

FFI的用途

在没有FFI之前,需要系统调用或者sdk方式调用的地方,PHP就需要开发扩展,但是开发扩展不仅需要理解C语言,还得了解PHP内核,比较困难。 现在就方便多了,直接使用FFI调用动态库即可。

扩展 宏展开

比如海康的sdk里有大量的宏 gcc -E -P HCNetSDK.h -o HCNetSDK_unfold.h 支持 type define 放心使用

原文地址:https://github.com/dwdcth/phpjieba_ffi

更多相关文章

  1. 中文分词 PHP 扩展 SCWS 安装方法
  2. php环境下使用elasticSearch+ik分词器进行全文搜索
  3. 2021.1.17——指针和结构体的初步认识
  4. PHP如何区分继承链中的$ this指针?
  5. solr6.3与MySQL结合使用的简明教程(五)——中文分词
  6. jieba(结巴)Python分词器加载到Eclipse方法
  7. Python自然语言处理实践: 在NLTK中使用斯坦福中文分词器
  8. 【python 编程】网页中文过滤分词及词频统计
  9. 堆栈/帧指针作为外部变量

随机推荐

  1. Android中drawable使用Shape资源
  2. Android:创建窗口式Activity
  3. 初始化有EditText或AutoCompleteEditText
  4. MPAndroidChart项目实战(七)——自定义横向
  5. android开发视频教程 android培训入门教
  6. Android多屏幕适配之字体大小、行间距和
  7. 关于android中的gif实现
  8. Android:Camera2开发详解(上):实现预览、
  9. android实现百度地图定位
  10. Android 4.0新增WiFiDirect功能