Process mining data extraction: OData vs direct SQL for large-scale analysis

joshua_sys · October 10, 2025, 4:59pm

We’re implementing process mining to analyze our order-to-cash process with 2+ million records. Need to extract event logs from Creatio for analysis in our process mining tool.

Two approaches being debated:

Use Creatio’s OData API for extraction - cleaner, respects business logic, but concerns about performance and API throttling with large datasets
Direct SQL queries against the Creatio database - faster extraction, full control, but bypasses business logic and might miss calculated fields

For process mining specifically, where you need bulk extraction of historical data, which approach has worked better? Main concerns are extraction speed and whether OData throttling becomes a bottleneck for real-time analysis updates.

matthewace · October 13, 2025, 11:03am

Good points on the business logic aspect. My concern with direct SQL is ongoing maintenance - if Creatio’s schema changes during upgrades, our extraction queries break. With OData, the API contract is more stable across versions. Has anyone experienced schema changes that broke their SQL-based extraction after Creatio upgrades?

ronaldmaster · October 10, 2025, 6:01pm

OData throttling is definitely a concern for large datasets. Creatio’s OData implementation has request limits and pagination caps. For 2 million records, you’ll need thousands of paginated requests, which takes hours. We tried this initially and extraction time was 6-8 hours for similar dataset sizes. Switched to direct SQL and got it down to 15-20 minutes. The trade-off is you need to understand Creatio’s database schema, but for process mining where you’re extracting raw event logs, that’s manageable.

charlessage · October 22, 2025, 12:30am

Real-time analysis updates are where the architecture choice really matters. If you’re doing one-time historical analysis, even 8 hours with OData is acceptable. But for continuous process mining where you want dashboards updated hourly or daily, extraction speed is critical. We implemented incremental extraction using SQL with timestamp-based filtering - only extract records modified since last extraction. This brings extraction time down to minutes even for large datasets. OData pagination makes incremental extraction more complex because you can’t efficiently filter and paginate simultaneously.

Topic		Views
Process mining data extraction: OData vs REST API for large-scale analytics OutSystems discussion , analytics , performance , rest-api , data-integration , process-mining , batch-processing , odata , integration-studio	4	January 14, 2025
Process mining vs traditional BPMN analytics: configuration trade-offs Creatio discussion , configuration , optimization , process-mining , process-analytics , bpmn , process-improvement , creatio-7-18 , process-mining-comparison	3	April 29, 2025
Process Mining API data extraction extremely slow for large datasets OutSystems question , api-development , performance , timeout , rest-api , process-mining , batch-processing , pagination , outsystems-11	5	May 21, 2025
Event log import fails for large CSV files in process mining Creatio question , performance-opt , process-mining , workflow-design , import-timeout , csv-processing , server-config , analysis-blocked , creatio-8-5	5	November 18, 2025
Process mining dashboard slow to load with large event logs ServiceNow question , performance-opt , query-optimization , process-mining , dashboard-performance , database-indexing , event-logs , snow-san-d , performance-ana	4	November 19, 2025
Comparing process mining data source integration: SAP vs Oracle EBS for supply chain visibility AgilePoint discussion , data-integration , process-mining , sap , supply-chain , agilepoint-nx , oracle-ebs , analytics-quality , api-support	5	March 6, 2025
Comparing Process Analytics API vs direct DB query for real-time dashboards OutSystems discussion , api-development , sql , rest-api , process-analytics , database-query , reporting-performance , outsystems-11	3	September 27, 2025
Challenges integrating process mining APIs with legacy ERP systems Appian discussion , api-development , analytics , compliance , erp-integration , process-mining , data-mapping , legacy-systems , appian-22-4	3	January 7, 2026
Bulk data import versus real-time sync for process automation Creatio discussion , api-integration , performance-opt , process-automation , error-handling , batch-processing , rate-limiting , data-import , creatio-8-5	7	March 2, 2025

Process mining data extraction: OData vs direct SQL for large-scale analysis

Related topics