shoujo
(usa Slackware)
Enviado em 18/06/2017 - 13:43h
Olá, não sei se é possivel, mas vou explicar o cenário..
Estou tentando construir um tradutor de páginas, tipo o que o google faz..
Preciso de capturar o texto de um site, substituir apenas o texto, as tags nao podem ser traduzidas ok?
Mas já tentei varias formas e nenhuma deu certo...
Será que tem como em php ou javascript?
No php sei que da pra remover as tags facilmente com strip tags, mas e depois como faço pra reinserir as tags de volta na variável?
Se alguém souber me ajudar pf.
vamos supor
<div>alguma coisa</div>
Vai ter dezenas, centenas de tag, tag dentro de tag e tudo dinamica, ja que vem dos sites prontos.
ai removo as tags com php... vai ficar so o texto, vamos supor que substituo alguma coisa por katakana -> アウグマコイサ
Quero que volte a ser assim
<div>アウグマコイサ</div>
Ai que tá o problema, como é que o negocio vai saber a posicao das divs, ou outras tags, onde elas estavam, etc?
PS: o viva o linux nao reconheceu os caracteres e veio codigo ascii, mas ai ta as letras em katakana japones
PS: Se ajudar vou dar mais uma dica do que preciso
Ta vendo essa função do php:
array preg_split ( string $pattern , string $subject [, int $limit [, int $flags ]] )
Pois é, ela divide uma string e esse $pattern pode ser uma expressao regular, assim posso dividir usando regex né?
Então, se eu der split em tudo que é array, ele me retorna um array com os valores distribuidos 0,1,2 etc
O que preciso é que ele inclua o $pattern tb nos arrays, ficando assim: 0- $patter, 1- valor1, 2-$pattern, 3- valor2
Lembrando que o valor do $pattern é alterado a cada vez que ele da split pois é um regex que detecta, eu quero a div correta.