B
    .(äb!  ã               @   sp   d Z ddlmZ ddlZdd„ Zej dddd	d
dg¡dd„ ƒZej ddddddddddddg¡dd„ ƒZdS )z9Test that longer and mixed texts are tokenized correctly.é    )Úunicode_literalsNc             C   s    d}| |ƒ}t |ƒdkst‚d S )Nu£  Una taula amb grans gerres de begudes i palles de coloraines com a reclam. Una carta
    cridanera amb ofertes de tapes, paelles i sangria. Un cambrer amb un somriure que convida a
    seure. La ubicaciÃ³ perfecta: el bell mig de la Rambla. PerÃ² Ã©s la una del migdia dâ€™un dimecres
    de tardor i no hi ha ningÃº assegut a la terrassa del local. El dia Ã©s rÃºfol, perÃ² no fa fred i
    a la majoria de terrasses de la Rambla hi ha poca gent. La immensa majoria dels clients -tret
    dâ€™alguna excepciÃ³ com al restaurant NÃºria- sÃ³n turistes. I la immensa majoria tenen entre mans
    una gerra de cervesa. Ens asseiem -fotÃ²graf i periodista- en una terrassa buida.éŠ   )ÚlenÚAssertionError)Úca_tokenizerÚtextÚtokens© r	   úL/home/dcms/DCMS/lib/python3.7/site-packages/spacy/tests/lang/ca/test_text.pyÚ#test_ca_tokenizer_handles_long_text   s    r   ztext,length)u   PerquÃ¨ va anar-hi?é   )u   â€œAh no?â€é   )u(   SÃ­! "Anem", va contestar el Joan Carlesé   )u   Van cÃ³rrer aprox. 10kmr   )u   Llavors perquÃ©...é   c             C   s   | |ƒ}t |ƒ|kst‚d S )N)r   r   )r   r   Úlengthr   r	   r	   r
   Útest_ca_tokenizer_handles_cnts   s    r   z
text,match)Ú10T)Ú1T)z10,000T)z10,00T)z999.0T)ZunT)ÚdosT)u   biliÃ³T)ZgosF)ú,F)z1/2Tc             C   s.   | |ƒ}t |ƒdkst‚|d j|ks*t‚d S )Né   r   )r   r   Zlike_num)r   r   Úmatchr   r	   r	   r
   Útest_ca_lex_attrs_like_number'   s    r   )	Ú__doc__Ú
__future__r   Zpytestr   ÚmarkZparametrizer   r   r	   r	   r	   r
   Ú<module>   s.   