我正在将Embeddable Common Lisp嵌入到库中,并且我一直在编写实用程序函数以将ECL的cl_object转换为各种C / C++类型-例如将代表字符串的cl_object转换为std::string。

我的问题是-为什么我无法在ECL中检索包含符号名称的字符串?

我在使以下函数ecl_symbol_to_string正常工作时遇到麻烦,该函数应使用ECL符号并返回带有其名称的std::string:

string ecl_symbol_to_string(cl_object sym) {
    return ecl_string_to_string(sym->symbol.name);
}

string ecl_string_to_string(cl_object echar) {
    string res("");
    int j = echar->string.dim; //get dimension
    ecl_character* selv = echar->string.self; //get pointer

    //do simple pointer addition
    for(int i=0;i<j;i++){
        res += (*(selv+i));
    }
    return res;
};

注意ecl_string_to_string适用于Lisp字符串。

一个简单的单元测试说明了失败:
TEST_CASE( "ecl_symbol_to_string returns a string for symbol",
           "[ecl_string_to_string]" ) {

  LispRuntime *rt = new LispRuntime("()");
  std::string eval_script;
  cl_object   eval_result;
  std::string subject_result;

  eval_script = "'mysymbol";
  eval_result = rt->evaluate(eval_script);
  REQUIRE( ECL_SYMBOLP(eval_result) );
  subject_result = ecl_symbol_to_string(eval_result);
  REQUIRE ( ECL_STRINGP(cl_symbol_name(eval_result)) );
  std::cout << subject_result.c_str() << std::endl;
  REQUIRE( subject_result.compare("mysymbol") == 0 );

  delete rt;

}

该测试用例打印出MM来调用cout。我也尝试过与失败的“MYSYMBOL”和通过的“M”进行比较。

LispRuntime::eval_script只需转换并评估以下形式:
cl_object LispRuntime::evaluate(std::string &code) {
  cl_object form = c_string_to_object(code.c_str());
  cl_object result = cl_eval(form);

  return result;
}

我在本地启用了C++选项,调试符号和所有其他默认设置的情况下编译了ECL版本16.1.3。非常感谢您的协助。

最佳答案

我相信这是Unicode /非Unicode的混合体:ECL在object.h中定义了两种字符串类型。一个是ecl_base_string,其中成员self最终将typedef定义为unsigned char*,另一个是ecl_string,其中成员self通常(取决于编译时参数,我认为)将typedef定义为int*。您正在以ecl_string的身份对其进行访问。

如果您跟踪ecl_make_symbol的工作原理,您会发现它最终会调用make_constant_base_string函数,该函数返回一个基本字符串。因此,您的ecl_string_to_string通过错误的类型访问它。

我怀疑最简单的解决方案是将类型检查/转换构建为ecl_string_to_string:

string ecl_string_to_string(cl_object echar) {
    switch (ecl_t_of(echar)) {
    #ifdef ECL_UNICODE
      case t_string:
        if (!ecl_fits_in_base_string(echar)) {
          echar = cl_copy_seq(echar);
        } else {
          echar = si_copy_to_simple_base_string(echar);
        }
        break;
    #endif
      case t_base_string:
        // OK
        break;
      default:
        // PRINT SOME ERROR
        return string(); // or raise an exception
    }

    string res("");
    int j = echar->base_string.dim; //get dimension
    ecl_base_char* selv = echar->base_string.self; //get pointer

    //do simple pointer addition
    for(int i=0;i<j;i++){
        res += (*(selv+i));
    }
    return res;
};

我添加的额外代码是从ECL函数 cl_make_symbol 中大量复制的。我决定转换为ecl_base_string而不是ecl_string,因为C++字符串无论如何都不接受unicode字符。如果您有充分的理由,则可以采取另一种方法。

10-08 09:44
查看更多