将XML文档中的所有扩展Unicode字符都转换为其等效的实体引用。例如,'& #x1F47D;”替换为'�”。
在Basex的配置文件中禁用扩展Unicode字符的解析。在basho.properties中添加以下一行:org.basex.parse.utf=false。这将使Basex在遇到扩展Unicode字符时停止解析。
示例代码:
XML文档:
这个段落中有一个笑脸& #x1F602;和一只猫& #x1F431;。
调用Basex解析器: import org.basex.; import org.basex.core.; import org.basex.query.; import org.basex.query.value.; import org.basex.query.value.seq.; import org.basex.query.value.item.; import org.basex.api.dom.; import org.w3c.dom.;
public class Example { public static void main(String[] args) { try(BaseXClient session = new BaseXClient("localhost", 1984, "admin", "admin")) { String xml = "\n\n
\n \n这个段落中有一个笑脸😂和一只猫🐱。
\n \n"; session.execute("CREATE DB testDB"); session.execute("OPEN testDB"); session.execute("ADD test.xml " + xml); session.execute("XQUERY //h1"); } catch(Exception e) { e.printStackTrace(); } } }此代码将输出以下错误消息: org.basex.query.QueryException: チ指定された文字 (Wiktionary defn) チ指定された文字の実体参照はデフォルトでは無効です。エスケープ (#) を使用して指
上一篇:Base析构函数中自身创建副本