sql FTS no latinas: la consulta de búsqueda de texto contiene solo palabras de finalización o no contiene lexemas, se ignora



postgresql utf-8 (0)

Intento usar Full Text Search con caracteres chinos usando una extensión FTS postgres (9.6.1) ZHParser .

Siguiendo algunos de los ejemplos aquí , quería seleccionar mi columna de title y to_tsvector el título to_tsvector con la cadena de consulta to_tsquery con:

select title from table1 where 
to_tsvector('testzhcfg',title) @@ to_tsquery('testzhcfg','你');

esquema table1 :

id  | title   
--------------
1   |      
2   | 你好    
3   | 我比你好 
4   | 谢谢    
5   | 淘气    

Esto da:

NOTICE:  text-search query contains only stop words or doesn't contain lexemes, ignored
 title 
-------
(0 rows)

Esperaba resultados:

rows: 

title   
-----
     
你好    
我比你好 

Ya que 你 está presente en cada uno.

Este artículo habla sobre el problema y recomienda garantizar la codificación de UTF8 DB. Me he asegurado de que la mesa sea UTF8:

mydatabase=# \l
                                             List of databases
      Name      |     Owner      | Encoding |   Collate   |    Ctype    |         Access privileges         
----------------+----------------+----------+-------------+-------------+-----------------------------------
 mydatabase     | myname         | UTF8     | en_US.UTF-8 | en_US.UTF-8 | =Tc/myname               +
                |                |          |             |             | myname=CTc/myname

¿Qué otras configuraciones se deben realizar para permitir que FTS funcione con caracteres no latinos, específicamente chinos?





chinese-locale