Superset软件是一款绿色安全、免费开源的数据探查与数据可视化平台,可以能够从具有Python DB-API驱动程序和SQLAlchemy的SQL的数据存储区或数据引擎中查询数据软件是一款专门为企业打造的商业智能Web应用程序,适用于各行业的企业公司进行使用;Superset这款软件拥有可视化、易用性和交互性等多种特性,可以能够帮主用户轻松对数据进行可视化分析,该软件运行程序自定义配置,可自由添加可视化插件软件是一款云原生架构,专为数据探查和分析而设计的软件,非常方便实用,有需要的用户赶快下载吧。

软件功能
快速创建数据可视化互动仪表盘。
丰富的可视化图表模板,灵活可扩展。
细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)。
简洁的语义层,可以能够控制数据资源在UI的展现方式。
与Druid深度集成,可以能够快速解析大规模数据集。
软件特色
直观的界面,用于可视化数据集和制作交互式仪表板
多种精美的可视化展示您的数据
无代码可视化构建器,用于提取和呈现数据集
世界一流的SQL IDE,用于准备数据以进行可视化,其中包括丰富的元数据浏览器
轻量级的语义层,使数据分析人员能够快速定义自定义维度和指标
对大多数说SQL的数据库能够提供开箱即用的支持
无缝的内存中异步缓存和查询
一种可扩展的安全模型,允许配置关于谁可以能够访问哪些产品功能和数据集的非常复杂的规则。
与主要的身份验证后端(数据库,OpenID,LDAP,OAuth,REMOTE_USER等)集成
添加自定义可视化插件的功能
用于程序化定制的API
云原生架构,专为规模而设计
官方教程
1.安装Docker引擎和Docker Compose
安装了Mac的Docker后,打开Docker的首选项窗格,转到“资源”部分,并将分配的内存增加到6GB。默认情况下,仅分配2GB的RAM,Superset将无法启动。
Linux
按照适用于您的任何Linux风格的Docker指导,在Linux上安装Docker。由于docker-compose未在Linux上作为基本Docker安装的一部分进行安装,因此,一旦拥有可用的引擎,请按照Linux的 docker-compose安装说明进行操作。
视窗
不幸的是,Windows上没有正式支持Superset。Windows用户在本地尝试Superset的最佳选择是通过VirtualBox安装Ubuntu桌面VM, 并继续在该VM中使用Linux上的Docker指令。我们建议为虚拟机分配至少8GB的RAM,并配置至少40GB的硬盘,以便为操作系统和所有必需的依赖项留出足够的空间。
2.克隆Superset的Github存储库
使用以下命令在您的终端中克隆Superset的仓库:
$ git clone https://github.com/apache/superset.git
该命令成功完成后,您应该superset在当前目录中看到一个新文件夹。
3.通过Docker Compose启动Superset
导航到您在步骤1中创建的文件夹:
$ cd superset
我们建议您检出并运行上一个标记版本的代码:
$ git checkout latest
然后,运行以下命令:
$ docker-compose -f docker-compose-non-dev.yml up
您应该看到一堵墙,记录着机器上正在启动的容器的输出。一旦此输出变慢,您应该在本地计算机上有一个正在运行的Superset实例!
注意:这将在非开发模式下显示超集,对代码库的更改将不会反映出来。如果要在开发人员模式下运行超集,只需将前面的命令替换为:
$ docker-compose up
然后等待superset_node容器完成资产的构建。
4.登录到超级集
您本地的Superset实例还包括一个Postgres服务器来存储您的数据,并且已经预先加载了Superset附带的一些示例数据集。现在,您可以能够通过Web浏览器访问Superset http://localhost:8088。请注意,许多浏览器现在默认为https-如果您是其中之一,请确保使用http。
使用默认的用户名和密码登录:
username: admin
password: admin
操作系统依赖性
Superset将数据库连接信息存储在其元数据数据库中。为此,我们使用加密Python库来加密连接密码。不幸的是,该库具有操作系统级别的依赖关系。
Debian和Ubuntu
以下命令将确保已安装必需的依赖项:
sudo apt-get install build-essential libssl-dev libffi-dev python-dev python-pip libsasl2-dev libldap2-dev
在Ubuntu 20.04中,以下命令将确保已安装必需的依赖项:
sudo apt-get install build-essential libssl-dev libffi-dev python3-dev python3-pip libsasl2-dev libldap2-dev
Fedora和RHEL衍生的Linux发行版
使用yum程序包管理器安装以下程序包:
sudo yum install gcc gcc-c++ libffi-devel python-devel python-pip python-wheel openssl-devel cyrus-sasl-devel openldap-devel
Mac OS X
如果您使用的不是最新版本的OS X,我们建议您进行升级,因为我们发现很多人遇到的问题都与较旧的Mac OS X相关。更新后,请安装最新版本的XCode命令行工具:
xcode-select --install
我们不建议使用系统安装的Python。相反,请先安装 自制软件管理器,然后运行以下命令:
brew install pkg-config libffi openssl python
env LDFLAGS= -L$(brew --prefix openssl)/lib CFLAGS= -I$(brew --prefix openssl)/include pip install cryptography==2.4.2
我们还要确保我们拥有pipand的最新版本setuptools:
pip install --upgrade setuptools pip
Python虚拟环境
我们强烈建议在虚拟环境中安装Superset。Python附带有 virtualenv开箱即用的功能,但是您可以能够使用以下命令进行安装:
pip install virtualenv
您可以能够使用以下方法创建和激活虚拟环境:

激活虚拟环境后,您安装或卸载的所有Python软件包都将限于此环境。您可以能够通过deactivate在命令行上运行来退出环境。
安装和初始化超集
首先,从安装开始apache-superset:
pip install apache-superset
然后,您需要初始化数据库:
superset db upgrade
通过运行以下命令完成安装:

如果一切正常,您应该能够在浏览hostname:port器中导航到(例如,默认情况下为本地localhost:8088),并使用您创建的用户名和密码登录。
在Kubernetes中使用Helm安装Superset
配置
要配置您的应用程序,您需要创建一个文件superset_config.py并将其添加到中 PYTHONPATH。以下是您可以能够在该文件中设置的一些参数:

https://github.com/apache/superset/blob/master/superset/config.py中定义的所有参数和默认值 都可以能够在本地更改superset_config.py。管理员将希望通读该文件以了解可以能够在本地配置的内容以及适当的默认值。
由于superset_config.py用作瓶配置模块,它可以能够被用于改变设置烧瓶本身,以及瓶扩展喜欢flask-wtf,flask-cache,flask-migrate,和flask-appbuilder。Superset使用的Web框架Flask App Builder能够提供了许多配置设置。请参阅 Flask App Builder文档 以获取有关如何配置它的更多信息。
确保更改:
SQLALCHEMY_DATABASE_URI:默认情况下,它存储在〜/ .superset / superset.db中
SECRET_KEY:随机的长字符串
如果您需要从CSRF中豁免端点(例如,如果您正在运行自定义auth回发端点),则可以能够将端点添加到WTF_CSRF_EXEMPT_LIST:
WTF_CSRF_EXEMPT_LIST = [‘’]
在WSGI HTTP Server上运行
虽然您可以能够在NGINX或Apache上运行Superset,但我们建议在异步模式下使用Gunicorn。这甚至实现了惊人的并发性,并且相当容易安装和配置。请参考您首选技术的文档,以在您的环境中正常运行的方式来设置此Flask WSGI应用程序。这软件是一个众所周知的异步设置,可以能够在生产环境中很好地工作:

有关更多信息,请参考Gunicorn文档。请注意,开发Web服务器(superset run或flask run)不适用于生产。
如果您不使用Gunicorn,则可能需要flask-compress通过COMPRESS_REGISTER = False在中进行设置 来禁用的使用superset_config.py。
负载均衡器背后的配置
如果您正在负载均衡器或反向代理(例如AWS上的NGINX或ELB)后面运行超集,则可能需要利用运行状况检查端点,以便负载均衡器知道您的超集实例是否正在运行。/health如果Web服务器正在运行,则能够提供此选项将返回200响应,其中包含“确定”。
如果负载均衡器正在插入X-Forwarded-For/X-Forwarded-Proto标头,则应ENABLE_PROXY_FIX = True在超集配置文件(superset_config.py)中进行设置 以提取和使用标头。
如果反向代理用于能够提供SSL加密,则X-Forwarded-Proto可能需要的明确定义 。对于Apache Web服务器,可以能够如下设置:
RequestHeader set X-Forwarded-Proto https
自定义OAuth2配置
除了受FAB支持的能够提供商(Github,Twitter,LinkedIn,Google,Azure等)之外,它还易于将Superset与其他支持“代码”授权的OAuth2 Authorization Server实现相连接。
首先,在Superset中配置授权superset_config.py。

然后,创建一个CustomSsoSecurityManager扩展SupersetSecurityManager并覆盖的 oauth_user_info:

该文件必须superset_config.py与名称 位于同一目录custom_sso_security_manager.py。最后,将以下两行添加到superset_config.py:
from custom_sso_security_manager import CustomSsoSecurityManager
CUSTOM_SECURITY_MANAGER = CustomSsoSecurityManager
功能标志
为了支持各种用户,Superset具有一些默认情况下未启用的功能。例如,某些用户具有更强的安全性限制,而另一些用户则没有。因此,Superset允许用户通过配置启用或禁用某些功能。对于功能所有者,您可以能够在Superset中添加可选功能,但仅会受到一部分用户的影响。
您可以能够使用标记来自来启用或禁用功能superset_config.py:

这是标志和说明的列表:
ENABLE_EXPLORE_JSON_CSRF_PROTECTION:出于某些安全方面的考虑,您可能需要在对explore_json端点的所有查询请求上强制实施CSRF保护。当 ENABLE_EXPLORE_JSON_CSRF_PROTECTION设置为true,您的用户无法GET请求 explore_json。此功能的默认值为,False并且explore_json将接受GET和POST请求。有关更多详细信息,请参见PR 7935。
PRESTO_EXPAND_DATA:启用此功能后,Presto中的嵌套类型将扩展为额外的列和/或数组。这是实验性的,不适用于所有嵌套类型。
SIP 15
Superset改进提案15的目的是确保对Druid和SQLAlchemy连接器以一致且透明的方式处理时间间隔。
在SIP-15之前,SQLAlchemy使用了包含端点,但是,如果未定义格式并且列格式不符合ISO 8601日期时间,则这些端点的行为可能类似于字符串列(由于按字典顺序)(有关详细信息,请参阅SIP)。 )。
为了解决此问题,而不必为每个非IS0 8601日期-时间列定义日期/时间格式,只需一次就可以能够通过extra参数在每个数据库级别上定义默认的列映射:

新部署
所有新部署都应通过在superset_config.py以下位置设置此值来启用SIP-15 :
SIP_15_ENABLED = True
现有部署
鉴于图表创建者是否意识到时间范围不一致(并相应地调整了端点)尚不清楚,因此更改所有图表的行为过于激进。相反,SIP-15能够提供了一种软过渡功能,允许生产者(图表所有者)查看提议的更改的影响并相应地调整其图表。
在启用SIP-15之前,现有部署应向用户传达更改的影响,并定义宽限期结束日期(当然不包括在内),之后所有图表均应符合[开始,结束]间隔。

为了提高透明度,在图表时间范围内明确指出了当前的端点行为(对于所有连接器和数据库,在SIP-15之后,它将是[开始,结束])。可以能够通过extra参数在每个数据库级别覆盖默认值。

请注意,在将来的版本中,将time_grain_endpoints通过代码更改和Alembic迁移来删除临时SIP-15逻辑(包括 表单数据字段)。
版权声明:Apache Superset(开源可视化平台)所展示的资源内容均来自于第三方用户上传分享,您所下载的资源内容仅供个人学习交流使用,严禁用于商业用途,软件的著作权归原作者所有,如果有侵犯您的权利,请来信告知,我们将及时撤销。
软件下载信息清单:
驱动文件名称 | 发布日期 | 文件大小 | 下载文件名 |
---|---|---|---|
Apache Superset(开源可视化平台)安装包 | 2024年11月17日 | 75.8 MB | superset.zip |
软件评论