Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Link parsing sometimes is buggy #79

Closed
Revertron opened this issue Jul 22, 2024 · 3 comments · Fixed by #80
Closed

Link parsing sometimes is buggy #79

Revertron opened this issue Jul 22, 2024 · 3 comments · Fixed by #80
Assignees
Labels
bug Something isn't working

Comments

@Revertron
Copy link

  • Operating System (Linux/Mac/Windows/iOS/Android): Windows
  • Delta Chat Version: 1.46.1
  • Expected behavior: All links in message are rendered like in browser
  • Actual behavior: Some links are broken and look like in markdown
  • Steps to reproduce the problem:
    The message is in HTML format:
<h1>Пост @denis-19 — Системное администрирование (+3) — 22.07.2024 09:02</h1>

<p>Проект OpenMandriva <a href="https://www.openmandriva.org///en/news/article/openmandriva-rome-24-07-released" rel="noopener noreferrer nofollow">представил</a> релиз <a href="https://www.openmandriva.org//" rel="noopener noref
errer nofollow">OpenMandriva ROME 24.07</a>. Это редакция дистрибутива OpenMandriva, использующая модель непрерывной доставки обновлений (rolling-выпуски). </p><p>Проект позволяет получить доступ к новым версиям пакетов, развивае
мым для ветки OpenMandriva Lx 6, не дожидаясь формирования классического дистрибутива.  </p><figure class="full-width "><img src="https://habrastorage.org/getpro/habr/upload_files/712/a02/0dd/712a020dd5cf5e1f46199d82b72ef845.jpeg
" alt="" title="" width="700" height="438"></figure><p><a href="https://sourceforge.net/projects/openmandriva/files/release/ROME/24.07/" rel="noopener noreferrer nofollow">Подготовлены</a> ISO‑образы размером 2.1–3.4&nbsp;ГБ с&nb
sp;рабочими столами KDE, GNOME и LXQt, поддерживающие загрузку в&nbsp;Live‑режиме. Сборки для&nbsp;KDE и LXQt доступны в&nbsp;вариантах x86_64&nbsp;и «znver1» (сборка, оптимизированная для&nbsp;процессоров AMD Ryzen, ThreadRipper
 и EPYC). Сборки с&nbsp;KDE поставляются в&nbsp;вариантах с&nbsp;Plasma 6&nbsp;X11, Plasma 6&nbsp;Wayland и Plasma 5.</p><p>Основные <a href="https://wiki.openmandriva.org/en/distribution/releases/current" rel="noopener noreferre
r nofollow">доработки</a> в OpenMandriva ROME 24.07: </p><ul><li><p>по умолчанию задействована среда рабочего стола <a href="https://www.opennet.ru/opennews/art.shtml?num=60686" rel="noopener noreferrer nofollow">KDE Plasma 6</a>
, сформированная на основе выпусков <a href="https://www.opennet.ru/opennews/art.shtml?num=61388" rel="noopener noreferrer nofollow">KDE Plasma 6.1.3</a>, KDE Frameworks 6.4.0, KDE Gears 24.05.2 и Qt 6.7.2. Доступны пакеты и сбор
ки с KDE Plasma 5.27.11, KDE Frameworks 5.116, KDE Gears 23.08.5 и Qt 5.15.14. По умолчанию используется графический стек на базе X11, но отдельно подготовлен iso-образ с KDE Plasma 6 на базе Wayland (поддержка Wayland в KDE отме
чена как пока не достаточно зрелая для замены X11 для большинства пользователей);</p></li><li><p>обновлены версии пользовательских окружений <a href="https://www.opennet.ru/opennews/art.shtml?num=61017" rel="noopener noreferrer n
ofollow">LXQt 2.0.0</a> и <a href="https://www.opennet.ru/opennews/art.shtml?num=60818" rel="noopener noreferrer nofollow">GNOME 46.3</a>;</p></li><li><p>компоненты графического стека обновлены до версий Xorg Server 21.1.13, Wayl
and 1.23.0 и Mesa 24.1.4;</p></li><li><p>в графический редактор Krita добавлен плагин для AI-генерации графики.</p></li></ul><p>Источник: <a href="https://www.opennet.ru/opennews/art.shtml?num=61587" rel="noopener noreferrer nofollow">OpenNET</a>.</p> <a href="https://habr.com/ru/posts/830386/">Читать дальше &rarr;</a>

<br/><a href="https://habr.com/ru/posts/830386/">https://habr.com/ru/posts/830386/</a>

<!-- 830386 -->

  • Screenshots:
    image

  • Logs:
    No logs

@link2xt
Copy link
Contributor

link2xt commented Jul 22, 2024

Minimal example:

  1. Fail: [test](https://www.openmandriva.org///en/news/article/openmandriva-rome-24-07-released)
  2. Success: [test](https://www.openmandriva.org/en/news/article/openmandriva-rome-24-07-released)

Parser has troubles with multiple / characters in the URL. HTML is converted to this "markdown" by deltachat core.

@link2xt link2xt added the bug Something isn't working label Jul 23, 2024
@link2xt
Copy link
Contributor

link2xt commented Jul 23, 2024

Python seems to be happy with it:

>>> from urllib.parse import urlparse
>>> urlparse("https://www.openmandriva.org///en/news/article/openmandriva-rome-24-07-released")
ParseResult(scheme='https', netloc='www.openmandriva.org', path='///en/news/article/openmandriva-rome-24-07-released', params='', query='', fragment='')

@link2xt
Copy link
Contributor

link2xt commented Jul 23, 2024

Made a fix: #80

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
bug Something isn't working
Projects
None yet
Development

Successfully merging a pull request may close this issue.

2 participants